Selon le PDG de Momenta, Cao Xudong, la conduite autonome est le premier test en conditions réelles pour les modèles d'IA qui alimenteront à terme tout, des robots aux systèmes de trafic urbain.
(Pékin) — Le fournisseur de logiciels de conduite autonome Momenta se positionne pour devenir l'OpenAI du monde physique, en lançant un nouveau modèle mondial qui utilise les données de plus de 800 000 véhicules pour prédire la physique du monde réel et le comportement des conducteurs. Le modèle R7 de la société, dévoilé au Salon de l'auto de Pékin 2026, est la base de ce que Momenta appelle « l'IA physique », une technologie qui, selon elle, s'étendra des voitures particulières à la logistique et au transport routier.
« La conduite autonome est entrée dans une phase où elle peut réaliser une boucle de rétroaction positive entre les données et la commercialisation », a déclaré Cao Xudong, PDG de Momenta, lors d'une interview. « C'est le prologue de l'IA physique car c'est la première application à grande échelle à résoudre les problèmes d'acquisition de données et de modèle économique qui ont freiné la robotique. »
Le modèle mondial R7 fonctionne sur trois couches : il s'entraîne d'abord sur des données de conduite réelles massives pour comprendre les lois physiques et les relations de cause à effet, puis utilise la simulation pour prédire comment le monde évolue en fonction de différentes actions, et enfin utilise l'apprentissage par renforcement pour entraîner le système à prendre les décisions optimales. Cette structure est conçue pour créer un cerveau de conduite qui apprend de l'expérience collective de sa flotte, qui comprend plus de 70 modèles de constructeurs automobiles tels que Mercedes-Benz, Audi et BMW.
Cette stratégie nécessite des capitaux immenses, Cao estimant que l'obtention d'une autonomie de niveau 4 évolutive nécessitera au moins 10 milliards de dollars d'investissement. En obtenant des contrats de production de masse pour ses systèmes d'aide à la conduite, Momenta a bâti une activité générant des flux de trésorerie pour financer le développement d'un modèle d'IA unifié pour tous les types de véhicules, un avantage clé par rapport aux concurrents dépendant uniquement du financement par capital-risque.
Le volant de l'IA physique
Le cœur de la stratégie de Momenta est de créer un volant de données qui est rare dans le monde physique. Alors que l'IA numérique a explosé grâce aux vastes données textuelles et d'images à faible coût provenant d'Internet, l'entraînement de l'IA pour des tâches physiques comme saisir une tasse ou naviguer dans une zone de construction nécessite un matériel coûteux et une interaction réelle. Cependant, les véhicules autonomes sont des plateformes de capteurs mobiles qui collectent en continu des données complexes, résolvant ainsi le problème de la rareté des données.
« Chacun des 800 000 véhicules que nous avons sur la route est un nœud de collecte de données », a expliqué Cao. « Les modèles d'OpenAI évoluent avec les requêtes des utilisateurs ; nos modèles évoluent avec chaque kilomètre parcouru dans le monde réel. »
Ces données alimentent le modèle mondial R7, qui dépasse la simple imitation des conducteurs humains. Selon Cao, les données brutes contiennent à la fois de bonnes et de mauvaises habitudes de conduite. Après un pré-entraînement pour apprendre le « bon sens » de la conduite, le modèle subit une phase de post-entraînement, similaire à l'apprentissage par renforcement à partir des commentaires humains (RLHF) dans les modèles de langage, pour aligner son comportement sur celui d'un conducteur qualifié et sûr, et non d'un conducteur moyen.
Une plateforme pour un prix de 10 milliards de dollars
L'ambition de Momenta va au-delà du rôle de fournisseur de rang 1 pour les voitures particulières. La société applique déjà son modèle unifié aux véhicules logistiques Robovan et prévoit d'entrer sur le marché des Robotrucks l'année prochaine. La conviction sous-jacente est qu'un modèle de conduite unique et puissant peut être adapté à n'importe quel type de véhicule, créant un avantage de plateforme similaire à ce que les entreprises de plateforme ont réalisé dans le commerce électronique.
« Nous pensons qu'un seul grand modèle de conduite autonome peut réaliser toutes les applications verticales de conduite autonome et le faire mieux », a déclaré Cao. Cette approche réduit le coût de développement pour chaque nouveau type de véhicule tandis que les données de chaque secteur vertical — qu'il s'agisse de taxis, de logistique ou de transport routier — améliorent le modèle de base pour tous.
Cette stratégie de plateforme est la réponse de Momenta au coût d'entrée immense. Cao estime que le développement d'un robot polyvalent pourrait nécessiter des investissements se chiffrant en centaines de milliards de dollars. Sans une activité générant des flux de trésorerie autonome, une telle entreprise est irréaliste. Le succès de Momenta sur le marché de la conduite assistée, avec plus de 200 modèles de véhicules signés, fournit le moteur financier pour poursuivre l'objectif beaucoup plus important de l'autonomie complète.
Cet article est uniquement à titre informatif et ne constitue pas un conseil en investissement.