輝達新款開源模型 Nemotron 3 Nano Omni 旨在統一文本、視覺和語音,以創建更快、更高效的企業級 AI 智能體。
返回
輝達新款開源模型 Nemotron 3 Nano Omni 旨在統一文本、視覺和語音,以創建更快、更高效的企業級 AI 智能體。

輝達公司正在從硬體供應商轉型為一家綜合平台公司,推出了 Nemotron 3 Nano Omni 開源模型,旨在構建更高效的企業級 AI 智能體。該模型集成了文本、視覺和語音功能,其吞吐量可達競爭對手開源全能模型的 9 倍,這一舉措直接挑戰了專有模型和其他開源替代方案。
「我們已經採用輝達 Nemotron 為客戶重塑企業 AI 推理,」雲基礎設施公司 Vultr 的首席執行官 J.J. Kardwell 表示。作為早期採用者,Vultr 正在其 GPU 集群中提供該模型,並通過其無伺服器推理服務進行分發。
這款新模型採用了 300 億參數的混合專家(MoE)架構,在任何給定時間僅激活 30 億參數,從而在高性能與成本效率之間取得了平衡。通過在單一框架內統一視覺和音頻編碼器,它消除了對獨立感知模組的需求,降低了延遲和成本。該模型旨在運行於高端消費級硬體和企業雲部署,並作為 Nvidia NIM 微服務在 Hugging Face 等平台上提供。
此次發布使輝達能夠捕捉 AI 價值鏈中更大的份額,從銷售 GPU 轉向提供智能體 AI 的基礎模型和工具。這一戰略使輝達「開放且高效」的生態系統與閉源領導者及其他開源社群展開競爭。早期採用者包括 Palantir Technologies Inc. 和鴻海科技集團(Foxconn),而戴爾(Dell Technologies Inc.)、甲骨文(Oracle Corp.)和印孚瑟斯(Infosys Ltd.)等公司目前正在對該模型進行評估。此舉表明,輝達的目標不僅是成為 AI 淘金熱中的「鏟子」供應商,還要成為整個建築藍圖的提供者。
Nemotron 3 Nano Omni 專門為智能體 AI(即能夠理解、推理並執行複雜、多步驟任務的系統)而設計。通過在 GUI(圖形用戶界面)數據上訓練模型,輝達使其能夠理解並與用戶界面元素交互,為自動化辦公流程和軟體操作鋪平了道路。另一家早期採用者 H Company 的首席執行官 Gautier Cloix 表示:「要構建有用的智能體,你不能等上幾秒鐘讓模型去解讀屏幕。基於 Nemotron 3 Nano Omni,我們的智能體可以快速解讀全高清屏幕錄像,這在以前是不切實際的。」 這種對執行和現實世界交互的關注,標誌著在構建從生成內容轉向執行任務的 AI 競爭中邁出了重要一步。
通過將 Nemotron 3 Nano Omni 作為開源模型發布,輝達正在圍繞其硬體培育開發者生態系統。該公司不僅提供模型權重,還提供訓練數據和 NeMo 工具包以促進開發。這一戰略可能會吸引廣泛的開發者和企業,他們正在尋找可定制、高性能的 AI 解決方案,而不希望被鎖定在封閉系統中。過去一年,Nemotron 系列的下載量已超過 5000 萬次,輝達正奠定堅實的基礎。這款開源、多模態模型的成功可能會加速企業對 AI 智能體的採用,並鞏固輝達在行業未來中的核心地位。
本文僅供參考,不構成投資建議。