Meta Platforms va déployer des dizaines de millions de processeurs Amazon Web Services Graviton5 dans le cadre d'un accord pluriannuel de plusieurs milliards de dollars, signalant un changement stratégique dans la manière dont les grandes entreprises technologiques construisent leur infrastructure pour l'intelligence artificielle de nouvelle génération. Cet accord élargit un partenariat de longue date et fait de Meta l'un des plus gros clients de Graviton au monde.
« Alors que nous dimensionnons l'infrastructure derrière les ambitions de Meta en matière d'IA, la diversification de nos sources de calcul est un impératif stratégique », a déclaré Santosh Janardhan, responsable de l'infrastructure chez Meta. « L'expansion vers Graviton nous permet d'exécuter les charges de travail gourmandes en CPU derrière l'IA agentique avec la performance et l'efficacité dont nous avons besoin à notre échelle. »
L'accord commence par des dizaines de millions de cœurs Graviton5 et offre une flexibilité d'expansion. Les puces sont conçues pour les tâches gourmandes en CPU au cœur de l'IA agentique, telles que le raisonnement en temps réel, la génération de code et la coordination de flux de travail complexes à plusieurs étapes. Alors que les GPU restent essentiels pour l'entraînement de modèles larges, cette décision souligne l'importance croissante des CPU spécialisés pour l'inférence à grande échelle et les systèmes basés sur des agents.
L'accord représente une validation significative de l'investissement de dix ans d'AWS dans le silicium personnalisé et constitue un défi direct aux fournisseurs de CPU traditionnels comme Intel et Advanced Micro Devices (AMD). Alors que les géants du cloud (hyperscalers) comme Meta cherchent à optimiser les performances et les coûts pour leurs charges de travail spécifiques, la tendance à s'éloigner des processeurs standard au profit de puces conçues sur mesure s'accélère, créant une nouvelle pression sur les activités de centre de données des acteurs historiques.
Graviton5 propulse l'IA agentique
L'essor des systèmes d'IA agentique — capables de raisonner, de planifier et d'exécuter des tâches de manière autonome — crée une demande massive de processeurs haute performance et économes en énergie. Le déploiement à grande échelle de Graviton5 par Meta est une réponse directe à cette tendance. La puce AWS Graviton5, basée sur la technologie 3 nanomètres, dispose de 192 cœurs et d'un cache cinq fois plus grand que son prédécesseur, réduisant les délais de communication entre les cœurs jusqu'à 33 %.
Ces spécifications fournissent la puissance de traitement et la bande passante nécessaires aux calculs continus et complexes requis par les ambitions de Meta en matière d'IA. Les puces seront prises en charge par le système AWS Nitro, qui offre un accès bare-metal et une mise en réseau haute performance via l'Elastic Fabric Adapter (EFA), permettant la communication à faible latence essentielle pour les charges de travail d'IA distribuées.
« Le partenariat élargi de Meta, déployant des dizaines de millions de cœurs Graviton, montre ce qui se passe lorsque vous combinez un silicium conçu sur mesure avec la pile d'IA complète d'AWS pour alimenter la prochaine génération d'IA agentique », a déclaré Nafea Bshara, vice-président et ingénieur distingué chez Amazon.
Un paysage concurrentiel en mutation
La décision de Meta de s'engager envers Graviton à grande échelle souligne une transition plus large de l'industrie. Pendant des années, les centres de données ont été dominés par l'architecture x86 d'Intel et d'AMD. Désormais, les fournisseurs de cloud conçoivent de plus en plus leurs propres puces basées sur Arm pour gagner en performance, en efficacité et en coût. Cet accord est une victoire majeure pour les efforts de fabrication de puces d'AWS et une perte potentielle de plusieurs milliards de dollars de marché adressable pour ses rivaux.
Cette initiative reflète également une approche plus diversifiée de l'infrastructure de l'IA. Alors que Nvidia reste le leader incontesté des GPU pour l'entraînement de l'IA, le marché de l'inférence est plus fragmenté. En utilisant Graviton5 pour les tâches d'inférence gourmandes en CPU, Meta peut optimiser sa pile d'infrastructure, en allouant le bon processeur à la bonne tâche. Cette approche hybride permet à Meta de poursuivre ses objectifs d'IA tout en gérant les coûts et en améliorant l'efficacité énergétique, conformément à ses objectifs de durabilité. Le Graviton5 offre des performances jusqu'à 25 % supérieures à celles de la génération précédente, un facteur clé pour les entreprises opérant à l'échelle planétaire.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.