Nvidia Vera Rubin 正式量產，代理式 AI 吞吐量較前代提升 10 倍

Nvidia 第三代 AI 平台的代理吞吐量是前代的 10 倍，將五個機櫃整合為一座專為代理式時代打造的單一超級電腦。

Nvidia 於週日宣布，其 Vera Rubin 平台正加速進入全面量產，超過 150 家台灣供應鏈合作夥伴正在製造相關系統，其代理式 AI 吞吐量較 Grace Blackwell 世代提升 10 倍。

Nvidia 創辦人暨執行長黃仁勳表示：「代理式 AI 是一種全新的工作負載。一個提示詞就能觸發上千個步驟的推理、檢索、工具使用與回應生成。Vera Rubin 正是為此刻而生——一座以規模化生產智慧的人工智慧工廠引擎。」

該平台整合了五個專用機櫃——Vera Rubin NVL72 系統、Vera CPU、Groq 3 LPX GPU、BlueField-4 STX 儲存裝置以及 Spectrum-6 SPX 乙太網路——以單一統一 AI 超級電腦的型態運作。它導入了 Spectrum-X Ethernet Photonics，這是業界首款採用共封裝光學技術的交換器，配備每秒 200 Gigabit 的 SerDes，現已投產。Nvidia 聲稱，與傳統收發器相比，這款基於光子學的網路架構可實現 5 倍的電源效率提升以及 5 倍的 AI 正常運行時間延長，這對於 AI 工廠擴展至百萬 GPU 集群而言是關鍵優勢。

量產出貨將於今年秋季開始，戴爾科技、慧與科技、聯想及 Supermicro 等系統製造商已在生產基於 Vera Rubin 的系統。此波量產之際，Nvidia 預測，從 Blackwell 到 Rubin 晶片世代，截至 2027 年的累計銷售額將達到一兆美元。此外，黃仁勳上週在台北對聽眾表示，該公司「在三到五年內價值將會更高」。Nvidia 股價目前為追蹤本益比的 32 倍，約為其五年中位數 61 倍的一半。

Vera Rubin 的量產代表著 Nvidia 第三代 MGX 機櫃級設計的到來。這是一個開源藍圖，允許來自 30 個國家、共 350 家工廠的數百家合作夥伴製造這些系統。每個 Vera Rubin 系統包含近 200 萬個零組件，並涉及約 150 家台灣供應鏈合作夥伴，涵蓋先進封裝、電源供應與熱管理等領域。

該平台是專為代理式 AI 工作流程所設計，這與傳統的模型訓練有根本上的不同。傳統大型語言模型中的單一提示詞可能只觸發一次推理過程，但代理式系統可以衍生出數百或數千個連續的推理步驟，每一步都需要檢索、工具呼叫與回應生成。Vera Rubin 的 10 倍吞吐量提升正是為了直接應對這種運算量爆炸的挑戰。

供應鏈在台灣持續深化

Nvidia 對台灣的投入正伴隨著 Vera Rubin 的量產而加深。黃仁勳上週表示，該公司預計每年在台灣的花費約為 1500 億美元，遠高於四、五年前的 100 億至 150 億美元規模。一座位於台北的新企業總部預計於 2027 年中動工，將雇用 4000 人，這也強化了台灣作為黃仁勳所稱「AI 革命中心」的角色。

然而，這種集中化也伴隨著風險。台灣積體電路製造股份有限公司是 Nvidia 先進晶片的唯一代工廠，其所處的區域是中國主張為其領土的地區。美國已實施出口管制，限制中國取得 Nvidia 最先進的 AI 處理器，不過黃仁勳表示，他在公司財報電話會議中所提出的 2000 億美元 CPU 市場機會包含了中國在內。美國已批准向約 10 家中國企業銷售 H200 晶片，但中國官員尚未核准這些出貨。

機櫃級安全防護

Vera Rubin 也在叢集層級引入了全堆疊機密運算，對高速互連中的資料進行加密，並提供硬體層級的可信度驗證，以確保系統無法被篡改。Nvidia DOCA 軟體平台能以高達每秒 800 Gigabit 的速度執行零信任策略、執行時期威脅偵測及多租戶隔離，而不會耗費主機 CPU 資源。CoreWeave、Microsoft Azure、IBM Cloud 及 Lambda 等雲端服務提供商正在採用此安全架構。

對投資人而言，Vera Rubin 的量產代表了 Nvidia 龐大供應鏈的下一個需求週期。該公司資料中心業務在最近一個財年營收達到 752 億美元，較前一年成長 85%；管理層預估本季營收約為 910 億美元。美銀給予 Nvidia 320 美元的目標價，意味著較目前水準約有 45% 的上漲空間。摩根士丹利的 Joseph Moore 則在最近的客戶報告中指出，目前的估值是「一個出乎意料的好進場點」。

本文僅供資訊參考，不構成投資建議。