Baseten的150億美元融資顯示,企業AI支出正從高價閉源模型轉向更便宜的開源替代方案。
Baseten的150億美元融資顯示,企業AI支出正從高價閉源模型轉向更便宜的開源替代方案。

Baseten的150億美元融資顯示,企業AI支出正從高價閉源模型轉向更便宜的開源替代方案。
Baseten是一家為開源模型建構推理基礎設施的AI新創公司,正完成一輪150億美元的融資,估值高達130億美元。這是最新一筆押注企業將AI支出從高價閉源模型轉向更便宜替代方案的投資。
「開源模型正變得非常、非常優秀,」Baseten聯合創始人兼執行長Tuhin Srivastava表示。「隨著開源技術的進步,我們也隨之成長。」
根據公司說明,本輪融資採用雙層結構,部分投資者以110億美元估值參與,另一部分則以130億美元估值進入。Altimeter Capital、Conviction、Spark Capital、Sands Capital以及Wellington Management共同領投本輪——這也是Wellington首次涉足AI推理領域。Baseten的軟體層架構在來自20家雲端供應商的運算能力之上,為客戶提供運行、優化及訓練開源模型的基礎設施,無需自行管理硬體。
這項押注反映了一場更廣泛的市場轉變。根據獨立測試,開源模型與閉源模型之間的品質差距已從2023年的兩年縮短至如今在關鍵工程基準測試上僅數週之久。DeepSeek-V4是一款擁有1.6兆參數的開源模型,每百萬輸出Token成本約為87美分——約為OpenAI和Anthropic前沿模型定價的三十分之一。如果企業將AI支出中的哪怕一小部分轉向開源替代方案,支撐超過2000億美元數據中心建設的營收預測可能面臨嚴重壓力。
推理層成為一門生意
Baseten是日益壯大的生態系統中一員,眾多新創公司正抓住推理熱潮的機遇——即AI模型利用運算能力回應查詢的過程。Cerebras專門為推理設計晶片,已於五月上市,目前市值接近500億美元。Fireworks AI於十月完成融資,估值達40億美元;而Factory是一家開發自主編碼代理的新創公司,已於四月達到15億美元估值。
其經濟效益正在推動採用。一位Baseten客戶告訴Srivastava,其在執行特定任務時僅需閉源模型30%的成本。大多數Baseten客戶混合使用開源與閉源模型,僅在需要絕對最佳性能的任務中使用前沿系統,而將常規工作負載導向更便宜的替代方案。
「開源模型總是比前沿模型落後幾個月,但它們能滿足大量使用案例,同時將頂級Token用量保留給最關鍵的任務,」Wellington Management投資人Oz Nur表示。
中國的開源攻勢
目前最受歡迎的開源模型來自中國實驗室。DeepSeek的V4系列與Z.ai的GLM-5.2在工程任務上的基準測試成績已可與領先的美國模型匹敵甚至超越。GLM-5.2在Terminal-Bench 2.1上獲得81.0分,而數週前發布的前一版本僅為62分。該模型擁有百萬Token的上下文窗口,每Token成本約為領先美國閉源模型的六分之一。
美國企業正試圖迎頭趕上。Nvidia最近推出了開源模型系列Nemotron,而Meta則持續開發其Llama系列。但中國實驗室的迭代速度更快——GLM在四個月內從5.0版推進到5.2版,且每次發布均在國產晶片上進行訓練。
投資者的算盤
對投資者而言,數學運算很直接。GPT-4等級的輸出成本從2022年底每百萬Token約20美元降至如今約40美分——降幅近千倍。由於記憶體短缺,今年的通縮趨勢暫停,但即將上線的新晶圓產能可能使這一趨勢重新啟動。與此同時,Nvidia的DGX Spark——一台售價4700美元、配備128GB統一記憶體的桌上型電腦——現已能本地運行參數量達2000億的模型。
如果前沿級別的開源模型能在價格親民的本地硬體上運行,那麼支撐數據中心GPU五年折舊週期的集中式推理需求可能增長得比預期更慢。Michael Burry已指出,整個行業到2028年將面臨約1760億美元的低估折舊,而美國原定於2026年啟動的數據中心項目中約有一半已面臨延遲或取消。
Baseten的客戶包括Cursor、Mercor及OpenEvidence。《The Information》此前報導了此輪融資。
本文僅供資訊參考,不構成投資建議。