Baseten融资15亿美元，AI推理需求激增20倍

这家为Cursor、Abridge和OpenEvidence等AI应用提供推理基础设施的公司，已成为科技行业增长最快的私营企业之一。随着企业将模型支出转向定制化和开源部署，其年营收同比增长约20倍。

总部位于旧金山的AI推理公司Baseten完成了由Altimeter Capital、Conviction和Spark Capital领投的15亿美元F轮融资，Sands Capital与Wellington Management担任联合领投方。该轮融资以两档结构完成，估值分别为130亿美元和110亿美元——这种结构在高增长AI融资轮中日益常见，允许不同类别的投资者按协商条款进入。

"AI的未来将建立在数以百万计的专业化模型之上，而打造最佳模型的公司深知，后训练环节已成生死攸关之事，"Baseten首席执行官兼联合创始人Tuhin Srivastava表示。"这是他们构建自有智能的方式——基于自有数据，针对所服务的客户进行优化。"

Baseten平台目前每天处理超过10亿次推理调用，横跨18家云提供商的87个集群。该公司的多云架构——一项核心卖点——使企业能够在不受任何单一云服务商锁定的情况下，同时部署来自Meta、Mistral和DeepSeek的开源模型以及专有前沿模型。据Baseten称，领先的应用层公司如今将30%至50%的模型支出投向定制化和后训练模型，因为开源模型的质量正以极低的成本逼近专有替代方案。

其技术基础是Truss，一个开源框架，可通过单个配置文件将机器学习模型打包为生产级API。开发者在一个YAML文件中指定模型、硬件和优化设置，Baseten便会编译一个TensorRT-LLM容器，部署至其云网络，并返回一个兼容OpenAI的端点。对于复合AI工作流——即串联语音转文本、语言模型和文本转语音步骤的语音管线——该平台的Truss Chains层直接在模型步骤之间流式传输数据，实现了低于400毫秒的端到端延迟。

推理市场正在以几乎前所未见的速度加速增长

本轮融资为一条令人瞩目的估值曲线画上了句号。Baseten于2025年9月以21.5亿美元估值完成1.5亿美元D轮融资，随后于2026年1月以50亿美元估值完成3亿美元E轮融资（其中包含来自英伟达的1.5亿美元）。不到一年的时间内估值飙升约6倍，反映出AI经济格局的结构性转变：德勤在2025年11月预计，推理工作负载将在2026年占全部AI算力的约三分之二，而三年前这一比例仅为三分之一，仅芯片领域的推理市场今年就将超过500亿美元。

LLM推理成本自2022年末以来已下降约千倍，使代理型应用在生产规模上具备经济可行性。据Sacra研究，至少有一家Baseten客户报告其推理成本约为闭源替代方案同等工作负载收费的30%。

"Tuhin和Baseten团队六年前做出了大多数人还未准备好的押注：AI的未来将建立在许多专业化模型之上，而构建这些模型的公司需要世界级的基础设施将其变为现实，"Altimeter Capital合伙人Apoorv Agrawal表示。"这一押注的回报之丰厚，怎么强调都不为过。"

资本部署与竞争格局

Baseten计划今年将员工人数增加两倍，投资于工程、研究、运营和企业市场团队。迄今为止，该公司已从Altimeter、Battery Ventures、Blackbird、Greylock、IVP、英伟达、Spark Capital和Wellington Management等投资方筹集超过20亿美元资金。

竞争格局包括提供托管推理服务的云超大规模企业——Amazon Bedrock、Google Vertex AI和Microsoft Azure AI——以及Together AI和Fireworks AI等专业推理提供商。Baseten的差异化在于其多云独立性和对定制化及后训练模型的专注，而非为热门模型提供共享推理能力。该公司瞄准那些无法容忍共享端点延迟波动、需要为微调模型提供专用GPU分配的企业。

对于投资者而言，Baseten的故事反映了一个更广泛的主题：随着基础模型商品化，AI领域的持久利润正向编排这些模型的基础设施层迁移。该公司的营收轨迹——据此前报道，单季度年化营收从约2亿美元跃升至6亿美元——表明市场已在为这一转变定价。Baseten的客户包括一些最具价值的私营AI公司，其平台正处于两大结构性趋势的交汇点：专业化模型的激增，以及企业对多云灵活性的需求。

本文仅供参考，不构成投资建议。