OpenAI 與輝達豪賭 400 億美元開啟 AI 推理大戰

一場針對人工智慧下一階段的戰略博弈正在升級。OpenAI 與輝達共計投入超過 400 億美元，旨在確保其在 AI 推理領域的霸權——即使用訓練好的模型生成響應的過程。這些舉措威脅到此前由輝達近乎獨家控制的市場，並標誌著半導體行業的一次重大架構變革。

這場衝突的首個信號出現在 2025 年 12 月，輝達低調完成了對專攻高速推理晶片的初創公司 Groq 價值 200 億美元的收購。隨後，反擊在 2026 年 4 月 17 日到來，據報導 OpenAI 將斥資超過 200 億美元向競爭對手 Cerebras Systems 採購晶片，並獲得該公司最高 10% 的股權。同日，Cerebras 提交了估值達 350 億美元的 IPO 申請。

這兩筆交易凸顯了 AI 行業的一次根本性再平衡。雖然訓練 GPT-4 等大型模型計算成本高昂，但這是一次性投入。而每當用戶提問時發生的「推理」，則是持續性的且最終規模更大的支出。根據 CES 2026 的市場研究，到 2026 年，推理預計將占所有 AI 計算支出的三分之二，一些高管認為這一比例甚至可能達到 80%。

「AI 行業的重心正迅速從單次的訓練任務轉移到每天數十億次的推理請求，」一位科技分析師指出，「這不僅僅是一個更大的市場；它是一個技術邏輯完全不同的市場，輝達在這裡的主導地位不再穩如泰山。」

### 架構分歧顯現
衝突的核心在於晶片設計。輝達的 GPU（如 H100）針對訓練所需的並行大規模計算進行了優化。然而，其對外部高頻寬記憶體（HBM）的依賴在推理場景下形成了瓶頸，因為在推理過程中，從記憶體中檢索模型權重的速度是主要的限制因素。

Cerebras 和 Groq 採取了不同的路徑。它們的晶片——分別是晶圓級引擎（WSE）和語言處理單元（LPU）——直接在矽片上集成了大量超高速 SRAM 存儲，緊鄰處理核心。這種設計大幅降低了記憶體延遲，據稱在執行某些任務時，推理速度比輝達現有的產品快 15 到 20 倍。

輝達斥資 200 億美元收購 Groq，是對這種架構弱點的某種默認。該公司並沒有僅僅依靠自身產品路線圖（如提升推理性能的新型 Blackwell B200），而是支付了高昂溢價來收購競爭技術。對於全球最大的 AI 晶片銷售商而言，這是一次防禦性舉措，旨在彌補其產品組合中的潛在缺口。

### OpenAI 的攻勢
相比之下，OpenAI 的交易是一項明確的進攻戰略。這家全球最大的 AI 模型提供商不僅僅是在分散供應商；它正在積極扶助輝達的挑戰者。協議內容包括超過 200 億美元的晶片採購、獲得 Cerebras 最高 10% 股份的認股權證，以及用於建設配套數據中心的 10 億美元投資。

這一舉措效法了蘋果的歷史戰略：深度整合並最終控制其晶片供應鏈。通過鎖定一個專屬的高性能推理供應商，OpenAI 減少了對輝達的依賴，並在大規模運行模型的成本控制上獲得了籌碼。據報導，該公司還在與合作夥伴博通（Broadcom）開發自研定制 ASIC 晶片，標誌著其正在多管齊下追求計算獨立。

對於投資者而言，Cerebras 的 IPO 呈現出一幅複雜的圖景。該公司（交易代碼為「CBRS」）目前的估值目標為 350 億美元，遠高於 2026 年 2 月的 230 億美元和 2025 年 9 月的 81 億美元。這是該公司的第二次 IPO 嘗試，此前其在 2024 年的申請因涉及當時最大客戶（阿聯酋 G42 基金）的國家安全問題而撤回。

雖然將 G42 替換為 OpenAI 作為核心客戶提升了收入質量，但並未解決客戶集中度的底層問題。參與此次 IPO 的投資者在押注 OpenAI 的需求將持續增長，且 Cerebras 能在 OpenAI 的自研晶片成為可行替代方案之前成功實現客戶多元化。這 350 億美元的疑問在於，這種樂觀情緒是否已被市場過度消化。

本文僅供參考，不構成投資建議。