Baseten籌資150億美元，押注開源AI模型成本更低

Baseten的150億美元融資顯示，企業AI支出正從高價閉源模型轉向更便宜的開源替代方案。

Baseten是一家為開源模型建構推理基礎設施的AI新創公司，正完成一輪150億美元的融資，估值高達130億美元。這是最新一筆押注企業將AI支出從高價閉源模型轉向更便宜替代方案的投資。

「開源模型正變得非常、非常優秀，」Baseten聯合創始人兼執行長Tuhin Srivastava表示。「隨著開源技術的進步，我們也隨之成長。」

根據公司說明，本輪融資採用雙層結構，部分投資者以110億美元估值參與，另一部分則以130億美元估值進入。Altimeter Capital、Conviction、Spark Capital、Sands Capital以及Wellington Management共同領投本輪——這也是Wellington首次涉足AI推理領域。Baseten的軟體層架構在來自20家雲端供應商的運算能力之上，為客戶提供運行、優化及訓練開源模型的基礎設施，無需自行管理硬體。

這項押注反映了一場更廣泛的市場轉變。根據獨立測試，開源模型與閉源模型之間的品質差距已從2023年的兩年縮短至如今在關鍵工程基準測試上僅數週之久。DeepSeek-V4是一款擁有1.6兆參數的開源模型，每百萬輸出Token成本約為87美分——約為OpenAI和Anthropic前沿模型定價的三十分之一。如果企業將AI支出中的哪怕一小部分轉向開源替代方案，支撐超過2000億美元數據中心建設的營收預測可能面臨嚴重壓力。

推理層成為一門生意

Baseten是日益壯大的生態系統中一員，眾多新創公司正抓住推理熱潮的機遇——即AI模型利用運算能力回應查詢的過程。Cerebras專門為推理設計晶片，已於五月上市，目前市值接近500億美元。Fireworks AI於十月完成融資，估值達40億美元；而Factory是一家開發自主編碼代理的新創公司，已於四月達到15億美元估值。

其經濟效益正在推動採用。一位Baseten客戶告訴Srivastava，其在執行特定任務時僅需閉源模型30%的成本。大多數Baseten客戶混合使用開源與閉源模型，僅在需要絕對最佳性能的任務中使用前沿系統，而將常規工作負載導向更便宜的替代方案。

「開源模型總是比前沿模型落後幾個月，但它們能滿足大量使用案例，同時將頂級Token用量保留給最關鍵的任務，」Wellington Management投資人Oz Nur表示。

中國的開源攻勢

目前最受歡迎的開源模型來自中國實驗室。DeepSeek的V4系列與Z.ai的GLM-5.2在工程任務上的基準測試成績已可與領先的美國模型匹敵甚至超越。GLM-5.2在Terminal-Bench 2.1上獲得81.0分，而數週前發布的前一版本僅為62分。該模型擁有百萬Token的上下文窗口，每Token成本約為領先美國閉源模型的六分之一。

美國企業正試圖迎頭趕上。Nvidia最近推出了開源模型系列Nemotron，而Meta則持續開發其Llama系列。但中國實驗室的迭代速度更快——GLM在四個月內從5.0版推進到5.2版，且每次發布均在國產晶片上進行訓練。

投資者的算盤

對投資者而言，數學運算很直接。GPT-4等級的輸出成本從2022年底每百萬Token約20美元降至如今約40美分——降幅近千倍。由於記憶體短缺，今年的通縮趨勢暫停，但即將上線的新晶圓產能可能使這一趨勢重新啟動。與此同時，Nvidia的DGX Spark——一台售價4700美元、配備128GB統一記憶體的桌上型電腦——現已能本地運行參數量達2000億的模型。

如果前沿級別的開源模型能在價格親民的本地硬體上運行，那麼支撐數據中心GPU五年折舊週期的集中式推理需求可能增長得比預期更慢。Michael Burry已指出，整個行業到2028年將面臨約1760億美元的低估折舊，而美國原定於2026年啟動的數據中心項目中約有一半已面臨延遲或取消。

Baseten的客戶包括Cursor、Mercor及OpenEvidence。《The Information》此前報導了此輪融資。

本文僅供資訊參考，不構成投資建議。