要点速览:
- Baseten完成15亿美元F轮融资,估值达130亿美元
- 年营收同比增长约20倍,日均推理调用量达10亿次
- 本轮融资反映开源模型缩小与专有前沿模型差距所带来的需求激增
要点速览:

这家为Cursor、Abridge和OpenEvidence等AI应用提供推理基础设施的公司,已成为科技行业增长最快的私营企业之一。随着企业将模型支出转向定制化和开源部署,其年营收同比增长约20倍。
总部位于旧金山的AI推理公司Baseten完成了由Altimeter Capital、Conviction和Spark Capital领投的15亿美元F轮融资,Sands Capital与Wellington Management担任联合领投方。该轮融资以两档结构完成,估值分别为130亿美元和110亿美元——这种结构在高增长AI融资轮中日益常见,允许不同类别的投资者按协商条款进入。
"AI的未来将建立在数以百万计的专业化模型之上,而打造最佳模型的公司深知,后训练环节已成生死攸关之事,"Baseten首席执行官兼联合创始人Tuhin Srivastava表示。"这是他们构建自有智能的方式——基于自有数据,针对所服务的客户进行优化。"
Baseten平台目前每天处理超过10亿次推理调用,横跨18家云提供商的87个集群。该公司的多云架构——一项核心卖点——使企业能够在不受任何单一云服务商锁定的情况下,同时部署来自Meta、Mistral和DeepSeek的开源模型以及专有前沿模型。据Baseten称,领先的应用层公司如今将30%至50%的模型支出投向定制化和后训练模型,因为开源模型的质量正以极低的成本逼近专有替代方案。
其技术基础是Truss,一个开源框架,可通过单个配置文件将机器学习模型打包为生产级API。开发者在一个YAML文件中指定模型、硬件和优化设置,Baseten便会编译一个TensorRT-LLM容器,部署至其云网络,并返回一个兼容OpenAI的端点。对于复合AI工作流——即串联语音转文本、语言模型和文本转语音步骤的语音管线——该平台的Truss Chains层直接在模型步骤之间流式传输数据,实现了低于400毫秒的端到端延迟。
推理市场正在以几乎前所未见的速度加速增长
本轮融资为一条令人瞩目的估值曲线画上了句号。Baseten于2025年9月以21.5亿美元估值完成1.5亿美元D轮融资,随后于2026年1月以50亿美元估值完成3亿美元E轮融资(其中包含来自英伟达的1.5亿美元)。不到一年的时间内估值飙升约6倍,反映出AI经济格局的结构性转变:德勤在2025年11月预计,推理工作负载将在2026年占全部AI算力的约三分之二,而三年前这一比例仅为三分之一,仅芯片领域的推理市场今年就将超过500亿美元。
LLM推理成本自2022年末以来已下降约千倍,使代理型应用在生产规模上具备经济可行性。据Sacra研究,至少有一家Baseten客户报告其推理成本约为闭源替代方案同等工作负载收费的30%。
"Tuhin和Baseten团队六年前做出了大多数人还未准备好的押注:AI的未来将建立在许多专业化模型之上,而构建这些模型的公司需要世界级的基础设施将其变为现实,"Altimeter Capital合伙人Apoorv Agrawal表示。"这一押注的回报之丰厚,怎么强调都不为过。"
资本部署与竞争格局
Baseten计划今年将员工人数增加两倍,投资于工程、研究、运营和企业市场团队。迄今为止,该公司已从Altimeter、Battery Ventures、Blackbird、Greylock、IVP、英伟达、Spark Capital和Wellington Management等投资方筹集超过20亿美元资金。
竞争格局包括提供托管推理服务的云超大规模企业——Amazon Bedrock、Google Vertex AI和Microsoft Azure AI——以及Together AI和Fireworks AI等专业推理提供商。Baseten的差异化在于其多云独立性和对定制化及后训练模型的专注,而非为热门模型提供共享推理能力。该公司瞄准那些无法容忍共享端点延迟波动、需要为微调模型提供专用GPU分配的企业。
对于投资者而言,Baseten的故事反映了一个更广泛的主题:随着基础模型商品化,AI领域的持久利润正向编排这些模型的基础设施层迁移。该公司的营收轨迹——据此前报道,单季度年化营收从约2亿美元跃升至6亿美元——表明市场已在为这一转变定价。Baseten的客户包括一些最具价值的私营AI公司,其平台正处于两大结构性趋势的交汇点:专业化模型的激增,以及企业对多云灵活性的需求。
本文仅供参考,不构成投资建议。