エヌビディアの新しいオープンソースモデル「Nemotron 3 Nano Omni」は、テキスト、視覚、音声を統合し、より高速で効率的な企業向けAIエージェントの構築を目指しています。
戻る
エヌビディアの新しいオープンソースモデル「Nemotron 3 Nano Omni」は、テキスト、視覚、音声を統合し、より高速で効率的な企業向けAIエージェントの構築を目指しています。

エヌビディア(Nvidia Corp.)は、より効率的な企業向けAIエージェントを構築するために設計されたオープンソースモデル「Nemotron 3 Nano Omni」のリリースにより、ハードウェアプロバイダーから包括的なプラットフォーム企業へと拡大しています。テキスト、視覚、音声の機能を統合したこのモデルは、競合するオープンなマルチモーダルモデルよりも最大9倍高速なスループットを実現でき、独自のプロプライエタリモデルや他のオープンソースの選択肢の両方に挑戦する動きとなります。
クラウドインフラ企業VultrのCEOであるJ.J. Kardwell氏は、「お客様のために企業のAI推論を再発明するため、NVIDIA Nemotronを採用しました」と述べています。初期導入企業であるVultrは、自社のGPUクラスターおよびサーバーレス推論サービスを通じてこのモデルを提供しています。
新しいモデルは、300億パラメータの混合エキスパート(MoE)アーキテクチャを採用しており、特定の時点でアクティブになるのは30億パラメータのみであるため、高いパフォーマンスとコスト効率を両立させています。視覚と音声のエンコーダーを単一のフレームワーク内に統合することで、個別の知覚モジュールが不要になり、遅延とコストが削減されます。このモデルは、ハイエンドのコンシューマ向けハードウェアと企業のクラウド展開の両方で実行できるように設計されており、Nvidia NIMマイクロサービスとして、またHugging Faceなどのプラットフォームで利用可能です。
この発表により、エヌビディアはGPUの販売を超えて、エージェント型AIの基盤モデルとツールを提供することで、AIバリューチェーンのより大きなシェアを獲得できる立場に立ちます。この戦略は、エヌビディアの「オープンかつ高性能」なエコシステムを、クローズドソースのリーダーや他のオープンソースコミュニティと対抗させるものです。初期導入企業にはPalantir Technologies Inc.やFoxconn Technology Groupが含まれ、Dell Technologies Inc.、Oracle Corp.、Infosys Ltd.などの企業も現在このモデルを評価しています。この動きは、エヌビディアがAIゴールドラッシュにおける「シャベル」だけでなく、建設プラン全体の提供者になることを目指していることを示唆しています。
Nemotron 3 Nano Omniは、複雑で多段階のタスクを理解、推論、実行できるシステムである「エージェント型AI」向けに特別に設計されています。GUIデータでモデルをトレーニングすることにより、エヌビディアはユーザーインターフェース要素を理解し操作することを可能にし、オフィスワークフローやソフトウェア操作の自動化への道を切り開いています。別の初期導入企業であるH Companyの最高経営責任者、Gautier Cloix氏は、「有用なエージェントを構築するために、モデルが画面を解釈するのを数秒も待つことはできません。Nemotron 3 Nano Omniに基づいて構築することで、私たちのエージェントはフルHDの画面録画を迅速に解釈できるようになります。これは以前は実用的ではありませんでした」と語っています。実行と現実世界での相互作用へのこの焦点は、コンテンツの生成からアクションの実行へと移行するAIの構築競争において、重要な一歩となります。
Nemotron 3 Nano Omniをオープンモデルとしてリリースすることで、エヌビディアは自社のハードウェアを中心とした開発者エコシステムを育成しています。同社はモデルの重みだけでなく、開発を促進するためのトレーニングデータやNeMoツールキットも提供しています。この戦略は、クローズドなシステムに縛られることなく、カスタマイズ可能で高性能なAIソリューションを求める幅広い開発者や企業を惹きつける可能性があります。過去1年間でNemotronファミリーのダウンロード数が5000万回を超えており、エヌビディアは強力な基盤を築いています。このオープンなマルチモーダルモデルの成功は、企業におけるAIエージェントの採用を加速させ、業界の将来におけるエヌビディアの中心的な役割を確固たるものにする可能性があります。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。