Le développeur chinois de GPU Moore Threads passe de la vente de puces à la fourniture d'une infrastructure d'IA complète, dans le but de capturer un marché intérieur en difficulté face aux contrôles à l'exportation des États-Unis.
La firme chinoise de GPU Moore Threads déploie une plateforme d'IA complète « du cloud au edge », défiant directement la domination de Nvidia Corp. en Chine en proposant un système intégré de matériel et de logiciel conçu pour abaisser la barrière à l'entrée pour les entreprises migrant de l'écosystème CUDA de Nvidia.
« La performance d'une carte unique est le point d'entrée, mais c'est la capacité du système qui influence l'approvisionnement et le réachat », indiquent les documents de presse de l'entreprise pour le lancement du 18 mai, signalant un pivot stratégique des composants vers la fourniture d'infrastructures d'IA intégrées.
Le lancement comprend le cluster de calcul exascale Kua'e, qui a été déployé et atteint jusqu'à 60 % d'utilisation des flops du modèle (MFU) dans l'entraînement de grands modèles. Il est complété par le SDK MUSA 5.1.0, désormais compatible avec CUDA 12.8 de Nvidia et prenant en charge les 3 194 opérateurs PyTorch.
Cette initiative positionne Moore Threads pour capturer une part du marché annuel de l'IA en Chine, estimé à 50 milliards de dollars, un segment où l'accès de Nvidia a été restreint par les limitations d'exportation américaines. En cas de succès, cette stratégie pourrait accélérer l'autosuffisance de la Chine en matière d'IA et remettre en cause les perspectives de revenus à long terme de Nvidia dans la région, qui représentait 17,1 milliards de dollars, soit 13 % de son total, avant la mise en œuvre des contrôles les plus stricts.
De fournisseur de GPU à architecte système
L'annonce de Moore Threads marque une évolution stratégique significative, passant de fournisseur de matériel à architecte système. La nouvelle matrice de produits de l'entreprise repose sur une approche à trois piliers : le cluster Kua'e pour l'entraînement à l'IA dans le cloud, les produits basés sur le nouveau SoC Changjiang pour les appareils edge et terminaux, et la plateforme MT Lambda pour la simulation. Ce portefeuille intégré est conçu pour prouver aux grands clients d'entreprise que la société peut fournir et maintenir un flux de travail d'IA complexe de bout en bout, un facteur crucial pour les clients entreprenant des projets d'IA sur plusieurs années.
Côté edge, la société a introduit le module E300, basé sur le SoC Changjiang, qui fournit 50 TOPS de puissance de calcul d'IA hétérogène pour des applications telles que l'inspection industrielle, les véhicules autonomes et la robotique nécessitant une inférence locale à faible latence. En fournissant une architecture unifiée du cloud au edge, Moore Threads vise à simplifier le déploiement pour les développeurs créant des applications d'IA hybrides.
Abaisser les douves de CUDA
Pendant des années, le plus grand obstacle pour tout concurrent potentiel de Nvidia a été CUDA, la plateforme logicielle propriétaire de la société qui est devenue profondément ancrée dans la communauté du développement de l'IA. Moore Threads s'attaque de front à ce défi. En ouvrant le code de vLLM-MUSA et en obtenant un support natif dans le framework populaire SGLang, l'entreprise s'efforce de minimiser les frictions auxquelles les développeurs sont confrontés en quittant l'écosystème de Nvidia.
Cet effort s'attaque à la « longue traîne » des problèmes de compatibilité — tels que les kernels personnalisés et les dépendances héritées — qui font souvent dérailler les projets de migration. Si la prise en charge des principaux frameworks est une exigence de base, s'assurer que l'intégralité de l'effort d'ingénierie historique d'une entreprise puisse être portée en douceur est le véritable test. L'accent mis par Moore Threads sur sa pile logicielle MUSA, incluant un outil de migration automatique, est une tentative directe de rendre ses GPU non seulement utilisables, mais faciles à adopter pour une communauté de développement largement formée aux outils de Nvidia.
Cibler l'IA incarnée
Le composant le plus tourné vers l'avenir de ce lancement est sans doute la plateforme de simulation MT Lambda, qui pousse le récit des GPU de Moore Threads dans le domaine de l'IA physique. À mesure que l'IA passe des espaces numériques à l'interaction avec le monde physique dans la robotique et la conduite autonome, le besoin d'une simulation haute fidélité devient primordial. L'entraînement de ces systèmes dans le monde réel est coûteux et dangereux.
Moore Threads positionne son « GPU multifonction », qui intègre le rendu graphique, la simulation physique et le calcul d'IA sur une seule puce, comme la base idéale pour ce travail. En permettant la génération efficace de données synthétiques et la validation des politiques de contrôle dans un environnement virtuel, la plateforme pourrait devenir une pièce d'infrastructure critique pour des entreprises comme Pony.ai et Zhipu AI, toutes deux listées comme partenaires. Cette initiative place Moore Threads non seulement face au matériel GPU de Nvidia, mais aussi face à ses plateformes de simulation complètes comme Omniverse.
Cette stratégie n'est pas sans risque. En élargissant son champ d'action des puces aux systèmes complets, Moore Threads est désormais en concurrence sur plusieurs fronts : la stabilité du cloud, l'expérience développeur et la performance des applications en conditions réelles. Cependant, avec les restrictions américaines créant une ouverture potentielle pour des acteurs nationaux comme Huawei et Moore Threads, l'opportunité d'être profondément ancré dans le développement de l'IA en Chine pourrait valoir le risque.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.