核心要點
- 隨著工作負載從簡單的推理轉向複雜的、CPU 密集型代理式 AI (Agentic AI),AI 數據中心對 CPU 的需求正在激增。
- 預計所需的 CPU 與 GPU 比例將從約 1:8 轉變至低至 1:1,從而產生嚴重的供應瓶頸。
- 作為回應,GPU 巨頭英偉達 (Nvidia) 和 IP 授權商安謀 (Arm) 均在 2026 年 3 月宣布計劃銷售其自有的伺服器級 CPU,直接進入該市場。
核心要點

AI 軍備競賽的焦點正從 GPU 轉向長期被忽視的 CPU,因為複雜的代理式 AI 工作負載的興起正威脅著要改變數據中心的基礎架構。所需的 CPU 與 GPU 比例預計將從 1:4 至 1:8 的範圍大幅縮減至 1:1,使這一此前被視為次要的組件面臨嚴重的產能瓶頸。
「CPU 正面臨極其嚴重的產能短缺,」SemiAnalysis 首席分析師 Dylan Patel 在 4 月的一次採訪中表示。他指出,AI 工作負載的範式正在從簡單的文本生成進化為由 AI 代理協調的複雜多步任務,這一過程高度依賴 CPU。
市場研究機構 TrendForce 在最近的一份報告中證實了這一判斷,預測在代理式 AI 時代,CPU 與 GPU 的比例將縮小至 1:1 到 1:2 之間。在這些新工作負載中,CPU 負責「編排層」——規劃任務、調用工具以及管理模型之間的數據流。2025 年的一篇學術論文《以 CPU 為中心的代理式 AI 視角》發現,在代理任務中,基於 CPU 的工具處理可能佔總延遲的 90.6%。安謀 (Arm) 計算得出,這意味著需求將增長四倍,從傳統 AI 數據中心的每吉瓦 3000 萬個 CPU 核心增加到代理式 AI 的 1.2 億個核心。
這種結構性需求衝擊正在重塑競爭格局,給英特爾的歷史主導地位帶來巨大壓力,同時也為 AMD 以及新進入者英偉達和安謀創造了巨大的增長機會。對於投資者而言,這開啟了在成熟的 GPU 交易之外,利用 AI 基礎設施建設獲利的新路徑。
這一轉變首先動搖了傳統的 x86 市場。英特爾曾佔據伺服器市場 95% 以上的份額,但其 7nm 工藝良率問題導致 Sapphire Rapids 芯片推遲了近兩年,為 AMD 的 EPYC Milan 打開了大門。英特爾 2026 年的路線圖,包括 288 核的 Xeon 6+ 和 256 核的 Xeon 7,依賴於其尚未經證實的 18A 工藝節點。TrendForce 報告稱,良率問題可能會將這些芯片的量產推遲到 2027 年,這可能使 AMD 憑藉其基於台積電 N2 工藝的 256 核/512 線程 EPYC Venice 繼續擴大市場份額。
更重大的變化是非傳統參與者的進入。2026 年 3 月,GPU 巨頭英偉達宣布將把其 Vera CPU 作為獨立產品銷售。該芯片採用台積電 N3 工藝,擁有 88 個核心,並可通過其 NVLink-C2C 互連技術與英偉達的 GPU 直接連接。同月,安謀結束了其 35 年純 IP 授權商的歷史,宣布推出自有 CPU——Arm AGI。這款 136 核芯片同樣採用台積電 N3 工藝,已獲得 Meta、OpenAI 和微軟的設計訂單。雲服務提供商也在加速其自研 CPU 設計,亞馬遜 (AWS) 的 Graviton5、微軟的 Cobalt 200 和谷歌的 Axion 均旨在降低 AI 工作負載的成本。
CPU 需求的激增在 GPU 之外創造了一個新的、尚未被充分評估的投資矢量。雖然英特爾 (INTC) 在其 18A 工藝上面臨重大執行風險,但 AMD (AMD) 有望繼續獲取市場份額。英偉達 (NVDA) 和安謀 (ARM) 的加入為兩家公司開啟了數十億美元的新收入流。非傳統 CPU 設計商的擴張也直接利好 IC 後端服務公司,如負責谷歌和微軟設計的創意電子 (GUC),以及更廣泛的台積電先進封裝生態系統。
本文僅供參考,不構成投資建議。