Key Takeaways:
- 发生了什么: AI 基础设施公司栖景科技完成了数亿元 Pre-A 轮融资,用于扩大其推理优化服务。
- 重要意义: 此次融资突显了市场从资本密集型模型训练转向成本高效的模型部署(推理)的重大转变,栖景科技声称可将成本降低高达 80%。
- 后续展望: 栖景科技将与阿里云、华为云等成熟云巨头以及其他初创公司展开竞争,争夺日益增长的 AI 推理市场,这正成为新的竞争战场。
Key Takeaways:

一家 AI 基础设施初创公司获得的大额早期融资,标志着市场正从模型训练的“暴力投入”转向运行模型的经济性。5 月 20 日,AI 基础设施提供商栖景科技宣布完成数亿元 Pre-A 轮融资,由星际资本(StarLink Capital)和华控技术领投,现有股东高瓴资本也参与了本轮融资。
在谨慎的风险投资市场中,这笔大额融资表明投资者的重点正在从“大即是好”的模型竞赛转移到商业部署的实际挑战。市场目前正在奖励那些能够解决大规模使用 AI 模型(即推理)所产生的高昂且通常低效成本的公司。
栖景科技的核心观点认为,行业对“模型即服务”(MaaS)的关注被误导了。相反,它提供“Token 即服务”(TaaS),直接将 AI 输出单元与成本联系起来。该公司针对 AI 部署中的一个关键效率瓶颈:硬件利用率。传统的推理方法严重依赖昂贵的 GPU 显存,导致系统中大量的 CPU 和标准 RAM 处于闲置状态,整体硬件利用率通常低于 20%。栖景科技的“六合”架构和“阅兵”技术旨在通过重新设计 AI 处理的关键组件 KV Cache 的管理方式来解决这一问题,从而减少对昂贵 GPU 的依赖。该公司已为智谱 GLM 等主流模型提供推理服务,每天处理近万亿个 Token。
随着 AI 行业开始面对规模扩张带来的隐形成本,对效率的关注应运而生。虽然基于数万亿参数训练的大语言模型(LLM)功能强大,但其运行成本高昂,且在许多任务中效率低下。一些企业发现,对于某些应用,更小、更紧凑的模型可以在性能和成本之间提供更好的平衡,响应速度比大型模型快 5 到 10 倍。这为能够优化总拥有成本的基础设施供应商创造了明确的商业机会,将关注点从前期模型成本扩展到包括维护、监控和能效在内的持续支出。
算力供需失衡加剧了对推理优化的需求。2026 年 3 月,腾讯云、阿里云和百度智能云等主要供应商上调了 AI 计算服务价格,部分模型成本涨幅超过 460%。这种环境为像栖景科技这样的专业公司创造了巨大空间。
然而,该公司面临着激烈的竞争。AI 基础设施领域不仅包括 Silicon Flow 和 MoreThanAI 等初创公司,还包括实力雄厚的云巨头。阿里云、华为云和字节跳动的火山引擎都在构建全栈 AI 基础设施能力。为了取得成功,栖景科技必须利用其资金建立足够深的技术护城河,并在巨头们缩小差距或提供能满足大众市场的“足够好”的捆绑服务之前锁住客户。该公司的成功将取决于其在快速发展的行业中将技术优势转化为持续商业增长的能力。
本文仅供参考,不构成投资建议。