輝達推出提速 9 倍的新模型，發力 AI 智能體市場

輝達公司正在從硬體供應商轉型為一家綜合平台公司，推出了 Nemotron 3 Nano Omni 開源模型，旨在構建更高效的企業級 AI 智能體。該模型集成了文本、視覺和語音功能，其吞吐量可達競爭對手開源全能模型的 9 倍，這一舉措直接挑戰了專有模型和其他開源替代方案。

「我們已經採用輝達 Nemotron 為客戶重塑企業 AI 推理，」雲基礎設施公司 Vultr 的首席執行官 J.J. Kardwell 表示。作為早期採用者，Vultr 正在其 GPU 集群中提供該模型，並通過其無伺服器推理服務進行分發。

這款新模型採用了 300 億參數的混合專家（MoE）架構，在任何給定時間僅激活 30 億參數，從而在高性能與成本效率之間取得了平衡。通過在單一框架內統一視覺和音頻編碼器，它消除了對獨立感知模組的需求，降低了延遲和成本。該模型旨在運行於高端消費級硬體和企業雲部署，並作為 Nvidia NIM 微服務在 Hugging Face 等平台上提供。

此次發布使輝達能夠捕捉 AI 價值鏈中更大的份額，從銷售 GPU 轉向提供智能體 AI 的基礎模型和工具。這一戰略使輝達「開放且高效」的生態系統與閉源領導者及其他開源社群展開競爭。早期採用者包括 Palantir Technologies Inc. 和鴻海科技集團（Foxconn），而戴爾（Dell Technologies Inc.）、甲骨文（Oracle Corp.）和印孚瑟斯（Infosys Ltd.）等公司目前正在對該模型進行評估。此舉表明，輝達的目標不僅是成為 AI 淘金熱中的「鏟子」供應商，還要成為整個建築藍圖的提供者。

智能體 AI 之爭

Nemotron 3 Nano Omni 專門為智能體 AI（即能夠理解、推理並執行複雜、多步驟任務的系統）而設計。通過在 GUI（圖形用戶界面）數據上訓練模型，輝達使其能夠理解並與用戶界面元素交互，為自動化辦公流程和軟體操作鋪平了道路。另一家早期採用者 H Company 的首席執行官 Gautier Cloix 表示：「要構建有用的智能體，你不能等上幾秒鐘讓模型去解讀屏幕。基於 Nemotron 3 Nano Omni，我們的智能體可以快速解讀全高清屏幕錄像，這在以前是不切實際的。」這種對執行和現實世界交互的關注，標誌著在構建從生成內容轉向執行任務的 AI 競爭中邁出了重要一步。

開放生態系統戰略

通過將 Nemotron 3 Nano Omni 作為開源模型發布，輝達正在圍繞其硬體培育開發者生態系統。該公司不僅提供模型權重，還提供訓練數據和 NeMo 工具包以促進開發。這一戰略可能會吸引廣泛的開發者和企業，他們正在尋找可定制、高性能的 AI 解決方案，而不希望被鎖定在封閉系統中。過去一年，Nemotron 系列的下載量已超過 5000 萬次，輝達正奠定堅實的基礎。這款開源、多模態模型的成功可能會加速企業對 AI 智能體的採用，並鞏固輝達在行業未來中的核心地位。

本文僅供參考，不構成投資建議。