Nvidia 首款專為 AI 代理設計的 CPU 已進入量產,任務完成速度比 x86 處理器快 1.8 倍,威脅英特爾與 AMD 的伺服器主導地位。
Nvidia 首款專為 AI 代理設計的 CPU 已進入量產,任務完成速度比 x86 處理器快 1.8 倍,威脅英特爾與 AMD 的伺服器主導地位。

Nvidia 首款專為 AI 代理設計的 CPU 已進入量產,任務完成速度比 x86 處理器快 1.8 倍,威脅英特爾與 AMD 的伺服器主導地位。
Nvidia 推出 Vera CPU,這是該公司首款專門為代理型 AI 工作負載打造的處理器,任務完成速度比 x86 替代方案快 1.8 倍,直接挑戰英特爾與 AMD 在資料中心運算領域數十年來的主導地位,隨著 AI 工廠規模持續擴大。
「AI 代理將成為運算的最大使用者,」Nvidia 創辦人暨執行長黃仁勳表示。「Vera 是第一款為這一未來而設計的 CPU——專為在超大规模下以卓越效能、效率與可程式化能力運行代理型 AI 而生。」
Vera 搭載 88 顆客製化 Olympus 核心,具備空間多執行緒技術及 LPDDR5X 記憶體子系統,頻寬高達 1.2TB/s。該晶片接替已出貨近 250 萬顆的 Nvidia Grace CPU。Phoronix 基準測試顯示,Vera 在代理型工作負載中全面領先,包括程式碼編譯、Python、Java 及資料庫處理。該晶片作為 Vera Rubin NVL72 系統的主機 CPU,透過第二代 NVLink-C2C 互連技術以 1.8TB/s 的一致頻寬運作,同時也為 AI 儲存平台驅動 Vera BlueField-4 STX 處理器。
此次發表標誌著 Nvidia 對英特爾與 AMD 伺服器 CPU 業務最直接的一次攻擊,該市場年規模約達 300 億美元。來自 Dell Technologies、HPE、Lenovo 與 Supermicro 的 Vera 系統將於今年秋季開始供貨,雲端部署則由 CoreWeave、Oracle Cloud Infrastructure 及 Lambda 率先採用。
Vera 架構鎖定代理型 AI 瓶頸
AI 工廠的經濟模式正從每核心成本轉向每 Token 成本,這要求 CPU 能更快完成編排與資料處理工作。Vera 的 Olympus 核心專為 Python 執行環境、沙盒程式碼執行及分析管線而設計——這些正是讓 GPU 閒置的 CPU 瓶頸步驟。該晶片的空間多執行緒技術能預測應用程式行為,並在大量並行環境之間移動資料,從而降低多步驟代理工作流程中的延遲——在該場景中,一個提示可能觸發上千步的推理旅程。
Vera CPU 可部署於完整的 AI 工廠——從獨立的 CPU 基礎設施到緊密耦合的加速系統。它將 Nvidia 的機密運算擴展至機架規模,透過高速互連加密資料,並配備硬體級認證,確保專有模型與受監管資料的防竄改執行。
廣泛採用對既有業者形成壓力
Nvidia 已獲得廣泛支援。正在評估或部署 Vera 的客戶包括 NYSE、Anthropic、OpenAI、SpaceXAI、字節跳動、CoreWeave、Lambda、Nebius、Nscale 及 Oracle Cloud Infrastructure。提供 Vera 系統的系統製造商涵蓋 Aivres、ASRock Rack、ASUS、Compal、Dell、Foxconn、GIGABYTE、HPE、Inventec、Lenovo、MiTAC Computing、MSI、Pegatron、Quanta Cloud Technology、Supermicro、Wistron 及 Wiwynn——總計 18 家製造商。
Vera Rubin 平台將 Vera CPU 與 Rubin GPU 配對,在規模化運作下,代理吞吐量較前一代 Grace Blackwell 平台提升 10 倍。該平台還導入採用共封裝光學技術的 Spectrum-X Ethernet Photonics,使百萬 GPU 規模的 AI 工廠電源效率較傳統收發器提升 5 倍。Nvidia 的供應鏈在台灣一地就涵蓋 150 家合作夥伴,橫跨 30 個國家的 350 座工廠。
對投資人而言,問題在於 Vera 能否在伺服器 CPU 市場中奪取可觀市佔率。Nvidia 股價目前約為預期本益比 35 倍。英特爾與 AMD 數十年來主導此一領域,但代理型 AI 工作負載的轉變創造了新的架構需求,有利於專用晶片。量產出貨將於今年秋季開始。
本文僅供資訊參考,不構成投資建議。