JD.com mobilise jusqu'à 600 000 personnes pour la collecte de données IA
Le 16 mars, le géant chinois du commerce électronique JD.com a annoncé son intention de construire le plus grand centre de collecte de données au monde pour l'intelligence incarnée, lançant une campagne massive pour s'attaquer à la « famine de données » qui paralyse l'industrie de la robotique. L'initiative vise à mobiliser plus de 100 000 de ses propres employés et jusqu'à 500 000 personnels externes, y compris 100 000 citoyens dans la seule ville de Suqian. L'objectif est d'accumuler plus de 10 millions d'heures de données d'interaction physique en temps réel sur deux ans, fournissant la matière première nécessaire pour former des robots sophistiqués à des tâches complexes. Cette tactique de la « marée humaine » représente une tentative de force brute pour résoudre ce qui est devenu le principal goulot d'étranglement pour la robotique IA, où les données d'entraînement de haute qualité sont désormais plus critiques que l'architecture des modèles ou la puissance de calcul brute.
Le projet est profondément intégré aux ambitions industrielles de la Chine, en particulier au sein de la Zone de développement économique et technique de Yizhuang à Pékin. Cette zone, qui abrite plus de 300 entreprises de robotique et une industrie de 10 milliards de yuans, fournit le matériel et les terrains d'essai. L'initiative de JD vise à fournir le « cerveau » en générant des ensembles de données massifs à partir de ses propres scénarios logistiques, industriels et de détail réels, créant un système en boucle fermée allant de la collecte de données à l'itération matérielle.
Le réseau logistique résout le problème des données coûteuses de la robotique
La stratégie de JD.com utilise son activité principale comme un avantage concurrentiel dans la course aux armements de l'IA. Contrairement aux entreprises de logiciels pures ou aux startups de robotique, la vaste chaîne d'approvisionnement physique de JD offre une source continue et étendue d'interactions complexes dans le monde réel. Cette approche s'attaque directement aux deux principaux obstacles à l'acquisition de données robotiques : le fossé « Sim-to-Real » et les coûts prohibitifs. Bien que de nombreuses startups s'appuient sur des simulations virtuelles, ces modèles échouent souvent à être transférés dans le monde réel car ils ne peuvent pas reproduire parfaitement les nuances physiques comme le frottement ou la déformation des matériaux flexibles.
L'alternative, la téléopération de robots pour enregistrer les actions humaines, est efficace mais économiquement inéluctable. Les estimations de l'industrie estiment le coût de la capture et du nettoyage d'une seule tâche d'interaction complexe de haute qualité à plusieurs centaines de dollars. En intégrant la collecte de données dans les opérations quotidiennes de ses coursiers et de ses employés d'entrepôt, JD vise à contourner ce goulot d'étranglement. Ce modèle, similaire à la façon dont Tesla utilise ses Gigafactories pour entraîner ses robots Optimus, transforme l'infrastructure opérationnelle existante d'une entreprise en une ligne de production de données propriétaire, créant une barrière à l'entrée significative pour les concurrents qui n'ont pas un tel accès au monde physique.
Les experts se demandent si 10 millions d'heures peuvent résoudre le goulot d'étranglement de la qualité
Malgré l'ampleur du projet, les experts de l'industrie examinent avec prudence si la quantité peut se traduire par la qualité nécessaire à une percée. Le défi fondamental en robotique n'est pas un manque de vidéo, mais une rareté de « paires état-action » qui incluent un retour physique précis, tel que la force, le couple et les données tactiles. Le simple enregistrement d'un coursier livrant un colis fournit des données visuelles pour le modèle mondial d'un robot, mais est presque inutile pour entraîner sa politique de contrôle – comment saisir fermement un objet sans l'écraser.
JD.com semble être conscient de ce défi, précisant que son plan comprend la collecte de « 1 million d'heures de données corporelles de robot » la première année. Cela suggère une approche hybride, combinant de larges vidéos centrées sur l'humain pour une compréhension générale avec des données plus ciblées et de haute fidélité provenant de robots effectuant des tâches. Cependant, des problèmes fondamentaux demeurent, y compris le manque de norme de données universelle. Les données collectées pour un type de robot sont souvent incompatibles avec un autre en raison de configurations matérielles différentes. Alors que JD pousse l'industrie vers une nouvelle phase de concurrence à forte intensité d'actifs, son succès dépendra non seulement de la résolution du problème du volume de données, mais aussi des défis beaucoup plus ardus de la qualité des données, de la normalisation et de la conformité.