Un trio de vétérans de Google et Meta a obtenu 100 millions de dollars de financement pour s'attaquer à un goulot d'étranglement critique de l'informatique d'IA qui laisse même les puces les plus puissantes à l'arrêt. La startup Majestic Labs AI développe une nouvelle architecture de serveur conçue pour briser le « mur de la mémoire » (memory wall), un problème qui pèse sur les centres de données et gaspille des milliards en matériel haute performance provenant de fabricants comme Nvidia.
La mission de l'entreprise est de repenser le flux de données au sein des serveurs pour suivre le rythme de l'appétit vorace des modèles d'IA modernes. « Les modèles d'IA géants submergent les serveurs et laissent les puces haute puissance inactives », ont déclaré les fondateurs, soulignant un problème dont ils ont été témoins directement lors du développement de silicium personnalisé chez Google (Alphabet) et Meta Platforms.
Majestic Labs AI a été fondée par Ofer Shacham, Masumi Reynders et Sha Rabii, qui ont précédemment travaillé sur les puces des centres de données de Google et ont ensuite constitué l'équipe de silicium personnalisé chez Meta Reality Labs. Leur tour de table de 100 millions de dollars, annoncé en novembre, comprend le soutien de Bow Wave Capital, Lux Capital et Grove, entre autres.
Cet investissement souligne un défi majeur pour l'ensemble de l'industrie de l'IA. À mesure que la taille et la complexité des modèles d'IA augmentent, le coût de leur exploitation grimpe en flèche, non seulement en consommation d'énergie mais aussi en potentiel gaspillé. La résolution du goulot d'étranglement de la mémoire pourrait améliorer considérablement l'efficacité de l'informatique d'IA, modifiant potentiellement le paysage concurrentiel tant pour les concepteurs de puces que pour les fournisseurs de services cloud.
Un embouteillage à un milliard de dollars
Le « mur de la mémoire » est un problème persistant en informatique, mais il a été exacerbé par l'échelle de l'IA actuelle. Le problème n'est pas la puissance de traitement des puces comme le GPU H100 de Nvidia, mais la vitesse à laquelle les données peuvent leur être transmises. Cela crée un embouteillage où le processeur attend les données, gaspillant des cycles et de l'énergie. Ce problème est une manifestation concrète de la « malédiction de la dimensionnalité », un terme utilisé par les physiciens et les mathématiciens pour décrire comment les coûts de calcul peuvent croître de manière exponentielle à mesure que l'on ajoute des variables à un système.
Pour les entreprises qui dépensent des milliards en infrastructure d'IA, cette inefficacité est un coup direct pour leurs résultats financiers. Un serveur rempli de processeurs puissants mais sous-utilisés représente une dépense d'investissement importante avec des rendements décroissants. Selon les recherches du Flatiron Institute, surmonter cette malédiction de la dimensionnalité est l'un des principaux moteurs des nouvelles méthodes de calcul centrées sur les données, y compris le matériel spécialisé.
Une nouvelle architecture pour l'IA
Alors que des concurrents comme Google avec ses Tensor Processing Units (TPU) et Amazon avec ses puces Trainium se sont concentrés sur la conception de meilleurs processeurs, Majestic Labs s'attaque au problème au niveau de la conception des serveurs. L'approche de l'entreprise, bien qu'elle ne soit pas totalement détaillée, suggère une refonte globale de la manière dont la mémoire et le traitement sont intégrés au sein d'une baie de serveurs, visant à éliminer les goulots d'étranglement qui existent entre les puces.
Cette stratégie place la startup en concurrence non seulement avec les fabricants de puces établis comme Nvidia et AMD, mais aussi avec les efforts de développement de matériel interne des anciens employeurs de ses fondateurs, Google et Meta. Ces géants de la technologie ont investi massivement dans la création de leur propre silicium personnalisé afin d'optimiser les charges de travail d'IA et de réduire leur dépendance vis-à-vis des fournisseurs tiers. Le succès de Majestic Labs dépendra de sa capacité à fournir une solution non seulement plus efficace, mais aussi largement compatible avec les divers matériels et logiciels utilisés dans l'industrie.
Cet article est fourni à titre indicatif uniquement et ne constitue pas un conseil en investissement.