Key Takeaways:
- 谷歌將其第八代 AI 晶片拆分為兩條獨立產品線:用於模型訓練的 TPU 8t 和用於低成本推理的 TPU 8i。
- 此舉標誌著戰略轉向支持「代理式 AI」(Agentic AI),即 AI 模型可以執行任務並編排工作流,而不僅僅是簡單的內容生成。
- 透過新型 TPU,谷歌旨在減少對輝達的依賴,並搶佔更大的 AI 基礎設施市場;摩根士丹利預計,到 2027 年,這可能為其增加 130 億美元的收入。
Key Takeaways:

谷歌首次將其定制 AI 晶片拆分為兩條獨立的產品線,這是對行業趨勢轉變的直接回應:即從單純的訓練模型轉向計算更為密集的模型運行(推理)過程。在 Cloud Next 大會上發布的第八代張量處理單元(TPU),包括一款功能強大的訓練晶片和一款獨立的高效推理晶片。此舉旨在挑戰輝達公司在 AI 硬體市場的統治地位。
「創建兩款新晶片的決定是『自然演進』的結果,」谷歌雲端執行長 Thomas Kurian 告訴記者。他補充道,新晶片的設計重點在於能效,「我們感到,隨著人們不斷擴大訓練和推理的規模,能效將成為一個瓶頸。」
新陣容包括:TPU 8t,專為大規模 AI 模型的密集訓練過程設計;以及 TPU 8i,針對運行模型以生成答案或執行操作的高容量、低強度推理任務進行了優化。谷歌表示,這兩款晶片比去年的第七代 Ironwood TPU 有了重大飛躍,將於今年晚些時候正式商用。TPU 8i 特別大幅增加了高頻寬記憶體(HBM),以解決可能拖慢代理式 AI 應用速度的「記憶體牆」問題。
這一戰略拆分是谷歌的一次豪賭,它認為人工智慧的下一個主要浪潮將是「代理」(Agents)——即能夠代表用戶進行推理、計劃和執行多步驟任務的自主 AI 系統。谷歌基礎設施負責人 Amin Vahadat 和 Mark Lohmeyer 在博客文章中表示:「AI 正從回答問題演變為推理並採取行動。」這種轉變需要大量的推理算力,而輝達也一直在通過新晶片和許可協議瞄準這一細分市場。
為了加速這一向代理的轉型,谷歌還推出了 Gemini 企業級代理平台,這是一個用於構建和管理 AI 代理的統一系統。此外,谷歌還設立了一項新的 7.5 億美元基金,幫助包括埃森哲、德勤和甲骨文在內的合作夥伴構建和部署這些解決方案。該平台提供了對 200 多種 AI 模型的訪問權限,包括谷歌自家的 Gemini 系列以及來自 Anthropic(谷歌雲端 TPU 的主要客戶)等公司的第三方模型。
開發更強大的自有晶片可能產生重大的財務影響。受 AI 需求推動,谷歌雲端 2025 年第四季度的收入增長了 48%,達到 177 億美元。通過開發定制晶片來減少對輝達的依賴,谷歌有可能降低成本並提高利潤率。摩根士丹利在 12 月的一份報告中估計,銷售 50 萬顆 TPU 晶片可在 2027 年為谷歌的資產負債表增加約 130 億美元的收入。
新晶片是谷歌一系列公告的一部分,旨在創建一個全面的、適配代理的技術棧。這包括「代理式數據雲」(Agentic Data Cloud)——一種 AI 原生數據架構,以及通過近期收購 Wiz 開發的新型 AI 驅動網路安全解決方案。通過控制從定制硬體到代理構建平台的整個技術棧,谷歌正強勢發力,力爭成為下一代 AI 時代的基石基礎設施提供商。
本文僅供參考,不構成投資建議。