Le nouveau modèle open-source de Nvidia, Nemotron 3 Nano Omni, vise à unifier le texte, la vision et la parole pour créer des agents IA d'entreprise plus rapides et plus efficaces.
Retour
Le nouveau modèle open-source de Nvidia, Nemotron 3 Nano Omni, vise à unifier le texte, la vision et la parole pour créer des agents IA d'entreprise plus rapides et plus efficaces.

Nvidia Corp. passe du statut de fournisseur de matériel à celui de société de plateforme complète avec le lancement de Nemotron 3 Nano Omni, un modèle open-source conçu pour créer des agents IA d'entreprise plus efficaces. Le modèle, qui intègre des capacités de texte, de vision et de parole, peut offrir un débit jusqu'à neuf fois supérieur à celui des modèles omni open-source concurrents, une initiative qui défie à la fois les modèles propriétaires et les autres alternatives open-source.
« Nous avons adopté NVIDIA Nemotron pour réinventer l'inférence IA d'entreprise pour nos clients », a déclaré J.J. Kardwell, PDG de la société d'infrastructure cloud Vultr. Vultr, l'un des premiers adoptants, rend le modèle disponible sur ses clusters GPU et via son service d'inférence sans serveur.
Le nouveau modèle présente une architecture Mixture-of-Experts (MoE) de 30 milliards de paramètres qui n'active que 3 milliards de paramètres à un moment donné, équilibrant haute performance et efficacité des coûts. En unifiant les encodeurs de vision et d'audio au sein d'un cadre unique, il élimine le besoin de modules de perception séparés, réduisant ainsi la latence et les coûts. Le modèle est conçu pour fonctionner à la fois sur du matériel grand public haut de gamme et sur des déploiements cloud en entreprise ; il est disponible sous forme de microservice Nvidia NIM et sur des plateformes comme Hugging Face.
Ce lancement permet à Nvidia de capturer une part plus importante de la chaîne de valeur de l'IA, en allant au-delà de la vente de GPU pour fournir les modèles fondamentaux et les outils de l'IA agentique. Cette stratégie oppose l'écosystème « ouvert et performant » de Nvidia aux leaders du code propriétaire et aux autres communautés open-source. Parmi les premiers adoptants figurent Palantir Technologies Inc. et Foxconn Technology Group, tandis que des entreprises comme Dell Technologies Inc., Oracle Corp. et Infosys Ltd. évaluent actuellement le modèle. Cette décision suggère que Nvidia vise à devenir le fournisseur incontournable non seulement pour les « pelles » de la ruée vers l'or de l'IA, mais pour l'ensemble du plan de construction.
Nemotron 3 Nano Omni est spécifiquement conçu pour l'IA agentique — des systèmes capables de comprendre, de raisonner et d'exécuter des tâches complexes en plusieurs étapes. En entraînant le modèle sur des données d'interface graphique (GUI), Nvidia lui permet de comprendre et d'interagir avec les éléments de l'interface utilisateur, ouvrant la voie à l'automatisation des flux de travail de bureau et des opérations logicielles. « Pour construire des agents utiles, vous ne pouvez pas attendre des secondes qu'un modèle interprète un écran », a déclaré Gautier Cloix, directeur général de H Company, un autre adoptant précoce. « En nous appuyant sur Nemotron 3 Nano Omni, nos agents peuvent interpréter rapidement des enregistrements d'écran en Full HD — ce qui n'était pas réalisable auparavant. » Cette focalisation sur l'exécution et l'interaction en monde réel marque une étape importante dans la compétition pour construire une IA qui passe de la génération de contenu à la réalisation d'actions.
En publiant Nemotron 3 Nano Omni en tant que modèle ouvert, Nvidia cultive un écosystème de développeurs autour de son matériel. L'entreprise fournit non seulement les poids du modèle, mais aussi les données d'entraînement et le kit d'outils NeMo pour favoriser le développement. Cette stratégie pourrait attirer une large base de développeurs et d'entreprises à la recherche de solutions d'IA personnalisables et performantes sans être enfermés dans un système fermé. Avec plus de 50 millions de téléchargements pour la famille Nemotron au cours de l'année écoulée, Nvidia bâtit des fondations solides. Le succès de ce modèle multimodal ouvert pourrait accélérer l'adoption des agents IA dans les entreprises et consolider le rôle central de Nvidia dans l'avenir du secteur.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.