Un nouveau rapport de Guotai Haitong soutient que le principal goulot d'étranglement de l'IA incarnée n'est plus les algorithmes mais une pénurie massive de données, créant un nouveau cycle d'investissement de type « pelles et pioches ».
Retour
Un nouveau rapport de Guotai Haitong soutient que le principal goulot d'étranglement de l'IA incarnée n'est plus les algorithmes mais une pénurie massive de données, créant un nouveau cycle d'investissement de type « pelles et pioches ».

Le passage d'une IA basée sur le langage à des « modèles mondiaux » physiquement interactifs crée un boom de l'investissement dans l'infrastructure de données sous-jacente nécessaire pour les entraîner. Le principal goulot d'étranglement de l'IA incarnée (Embodied AI) n'est plus les algorithmes mais un immense déficit de données, la demande de données gonflant à l'échelle de l'exaoctet, selon un nouveau rapport de Guotai Haitong. Cela positionne les entreprises de collecte, de simulation et de traitement de données comme le cœur de la stratégie « pelles et pioches » pour la prochaine vague d'intelligence artificielle.
« Les entreprises qui combleront les premières ce déficit de données agiront comme les 'vendeurs de pelles' de l'ère de l'IA physique, commandant des primes de valorisation significatives », indique le rapport de Guotai Haitong.
Les besoins en données pour l'intelligence incarnée sont supérieurs de plusieurs ordres de grandeur à ceux des grands modèles de langage (LLM). Alors que les LLM sont entraînés sur des ensembles de données de textes et d'images à l'échelle du pétaoctet, les robots qui interagissent avec le monde nécessitent des données à l'échelle de l'exaoctet incluant la physique de l'interaction — force, toucher et friction. Ces données spécialisées et de haute qualité sont d'une rareté critique, créant un goulot d'étranglement fondamental pour toute l'industrie de la robotique.
Cette pénurie force une réévaluation de la chaîne de valeur de la robotique. L'accent se déplace du matériel robotique lui-même vers les fournisseurs d'infrastructures de données capables de résoudre le problème de la collecte et du traitement. Cette tendance pourrait déclencher un afflux important de capitaux vers un nouveau sous-secteur de valeurs technologiques axé sur les outils et services de données, leur bénéficiant potentiellement plus qu'aux fabricants de robots à court terme.
Pour combler le manque de données, l'industrie poursuit trois voies principales, chacune avec des compromis distincts :
Données du monde réel : Collectées via des plates-formes de téléopération pilotées par l'homme et des combinaisons de capture de mouvement, cette méthode fournit les données les plus fidèles car elles contiennent de véritables interactions physiques. Cependant, son coût est prohibitif, son extension est difficile et elle ne peut pas couvrir tous les scénarios limites. Des entreprises comme 1X Technologies privilégient cette approche, arguant que c'est le seul moyen de franchir le fossé « Sim2Real ».
Données synthétiques et de simulation : Utilisation de moteurs physiques pour générer des ensembles de données massifs et parfaitement étiquetés dans des environnements virtuels. Cette approche est peu coûteuse et évolutive, des entreprises comme Galaxy General visant un ratio de 99 pour 1 entre données synthétiques et réelles. Sa principale faiblesse est le fossé « Sim2Real », où les modèles entraînés en simulation ne parviennent pas à fonctionner de manière fiable dans le monde réel en raison de subtiles différences physiques.
Données vidéo : Une approche plus récente qui utilise le vaste répertoire de vidéos sur Internet pour enseigner aux modèles. Des entreprises comme Tesla et Figure AI pivotent vers cette méthode, estimant que l'échelle massive des données vidéo l'emporte sur l'absence de propriétés physiques directes. Le défi réside dans la « montée en dimension » de la vidéo 2D en action 3D, un obstacle technique complexe.
Le consensus actuel est qu'une approche hybride — utilisant la simulation et la vidéo pour le pré-entraînement de masse, puis un affinement avec des données réelles plus petites et de haute qualité — deviendra la norme de l'industrie.
Cette divergence stratégique est visible dans toute l'industrie. Tesla a notoirement abandonné la téléopération pour son robot Optimus, s'appuyant plutôt sur la vidéo de sa flotte de véhicules. Figure AI, soutenu par OpenAI et Microsoft, a lancé le « Project Go-Big » pour explorer le transfert de compétences de vidéos humaines vers ses robots avec un apprentissage zero-shot.
À l'inverse, des startups comme Zhìyuán Jīqìrén (智元机器人) en Chine utiliseraient 100 % de données du monde réel pour l'entraînement de leurs grands modèles. Cela souligne les paris stratégiques faits sur la source de données qui s'avérera finalement la plus efficace.
La tendance s'étend au-delà de la robotique. Le géant indien de la fintech Paytm, malgré ses ambitions de grande envergure en matière d'IA, n'a pas l'intention de construire ses propres centres de données. Au lieu de cela, il louera de la capacité de calcul auprès de fournisseurs comme NVIDIA et exécutera ses modèles propriétaires sur une infrastructure tierce, comme l'a confirmé le PDG Vijay Shekhar Sharma lors de l'alerte sur les résultats du T4 de l'exercice 26. Cette stratégie valide la thèse du « vendeur de pelles » : même les grands acteurs de la tech choisissent d'être clients, et non concurrents, des fournisseurs d'infrastructures de base.
Le marché récompense déjà les « vendeurs de pelles ». Comme on le voit avec l'essor des licornes alimenté par l'IA en Europe et les levées de fonds massives comme les 2 milliards de dollars récoltés par le Chinois Moonshot AI, les investisseurs injectent des capitaux dans les entreprises qui fournissent des capacités fondamentales. Selon le rapport de Guotai Haitong, l'investissement se concentre dans quatre domaines clés :
Pour les investisseurs, cela signifie que les opportunités les plus prometteuses dans l'espace de l'IA incarnée ne sont peut-être pas les entreprises qui construisent les robots, mais celles qui vendent les données et les outils essentiels nécessaires pour les rendre intelligents.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.