L'architecture CPU d'Arm contrôle désormais environ 50 % des calculs chez les hyperscalers, un changement structurel confirmé au Computex 2026 alors qu'AMD est entré en production de volume sur le premier processeur serveur en 2 nm de l'industrie et qu'Intel a officiellement lancé son Xeon 6+ gravé en 18A.
« Cette réinvention de l'ordinateur est aussi importante que la réinvention du téléphone en ce que nous appelons aujourd'hui le smartphone », a déclaré Jensen Huang, PDG de Nvidia, lors d'une conférence de presse au Computex, en référence à la nouvelle puce RTX Spark pour PC, co-développée avec MediaTek.
La part d'Arm chez les hyperscalers était d'environ 18 % à la mi-2024 avant de grimper à 50 % en environ deux ans, coïncidant avec le virage de l'industrie vers l'investissement dans les infrastructures d'IA. Amazon Web Services a révélé que son activité de silicium sur mesure — incluant les CPU Graviton basées sur Arm, les accélérateurs IA Trainium et les puces réseau Nitro — a franchi le cap des 20 milliards de dollars de revenus annualisés, avec une croissance à trois chiffres d'une année sur l'autre. Google a annoncé que ses prochaines générations de TPU remplaceront les processeurs hôtes x86 par des CPU Axion personnalisées basées sur Arm, offrant jusqu'à 2 fois meilleur rapport performance-par-watt que la génération x86 précédente. Microsoft continue de faire progresser sa stratégie de CPU Cobalt basée sur Arm, désormais déployée dans les régions Azure et alimentant des charges de travail de production pour des clients comme Databricks, Siemens et Snowflake.
Pour le marché du cloud computing, valorisé à 200 milliards de dollars, l'implication est directe : les entreprises choisissent désormais entre architectures, et pas seulement entre fournisseurs. Les actions Nvidia ont grimpé de plus de 6 % lundi après l'annonce du RTX Spark, tandis qu'Intel a chuté d'environ 6 % et AMD d'environ 5 %, les investisseurs intégrant l'entrée de Nvidia sur un marché de processeurs PC que les deux sociétés contrôlent conjointement depuis quatre décennies.
Le Venice 2 nm d'AMD arrive le premier
AMD est arrivé au Computex avec un argument qu'aucun concurrent ne peut encore égaler. L'EPYC « Venice », le processeur serveur de sixième génération de la société, est entré en production de volume à grande échelle sur le procédé 2 nm de TSMC — ce qui en fait le premier produit de calcul haute performance de l'industrie à atteindre ce nœud. Le nœud 2 nm embarque plus de transistors par millimètre carré, améliorant la performance par watt tout en réduisant la taille des puces.
La bande passante mémoire par socket double pour atteindre 1,6 To/s, contre 614 Go/s sur la génération précédente, tandis que la bande passante CPU- GPU bénéficie d'un doublement — des chiffres qui répondent directement au goulot d'étranglement de la bande passante mémoire dans les charges de travail d'inférence et d'entraînement IA. La configuration phare monte à 256 cœurs par socket, avec une amélioration revendiquée de 70 % des performances par rapport à la génération EPYC précédente. La plateforme rack-scale Helios d'AMD, associant les CPU Venice aux GPU Instinct MI450X, est en bonne voie pour des déploiements multi-gigawatts au second semestre 2026.
Venice ne voyage pas sans risque pour la chaîne d'approvisionnement. La production d'AMD partage la capacité N2 de TSMC avec Apple, qui a sécurisé environ la moitié de la production disponible en 2 nm de TSMC pour son processeur A20 de l'iPhone 18 et ses puces de la série M, ainsi qu'avec Qualcomm, Nvidia et MediaTek. Les équipes d'approvisionnement des hyperscalers à Taipei suivent de près la dynamique d'allocation des plaques de 2 nm cette semaine ; c'est l'offre, et non les spécifications, qui pourrait déterminer quels acheteurs auront accès à Venice en premier.
La réponse d'Intel en 18A et l'ambition PC de Nvidia
Intel est arrivé avec sa réponse la plus directe au défi d'Arm et d'AMD. La famille Xeon 6+ — nom de code Clearwater Forest — intègre pour la première fois le nœud de processus 18A d'Intel dans du matériel serveur commercialisé. Le Xeon 6990E+ phare embarque 288 cœurs d'efficacité Darkmont dans un seul socket, avec 576 Mo de cache L3 et un support mémoire DDR5-8000 à 12 canaux, et est disponible immédiatement via Dell Technologies, Hewlett Packard Enterprise, Lenovo et Supermicro.
Intel affirme que le 6990E+ offre 30 % de performance moyenne par thread de plus que l'EPYC 9965 à 192 cœurs d'AMD. Cette comparaison cible une puce que la feuille de route Venice d'AMD remplacera avant même que la plupart des cycles de renouvellement des entreprises ne soient terminés. Nish Neelalojanan, directeur principal de la gestion de produits du groupe Client Computing d'Intel, a reconnu la pression concurrentielle du RTX Spark de Nvidia avec franchise lors d'une table ronde de presse au Computex, déclarant qu'Intel relève le défi avec « une dose saine de paranoïa » tout en soulignant le fossé de la compatibilité logicielle du x86.
Le Superchip RTX Spark de Nvidia, co-développé avec Microsoft et MediaTek, associe 20 cœurs CPU Arm à un GPU de classe Blackwell doté de 6 144 cœurs CUDA, 128 Go de mémoire unifiée LPDDR5x et une cible de calcul IA annoncée de 1 pétaflop. Nvidia s'est engagé sur une feuille de route multi-générations, détaillant les futures générations de puces pour ordinateurs portables et systèmes de bureau. Les partenaires OEM de lancement confirmés incluent Microsoft, Dell, HP, ASUS, Lenovo et MSI, avec des appareils grand public attendus cet automne. Morgan Stanley estime les expéditions de puces RTX Spark entre 5 et 8 millions d'unités en 2026, avec des appareils premium au prix de 2 899 $ pour la variante N1X et de 1 799 $ pour la N1.
La menace concurrentielle comporte de réelles limitations. Windows sur Arm présente encore des lacunes documentées dans la prise en charge des logiciels anti-triche, la couverture des pilotes périphériques et la compatibilité avec certaines applications professionnelles — des problèmes que Neelalojanan d'Intel a directement cités au Computex. Nvidia et Microsoft ont promis un programme de certification de compatibilité, mais aucune donnée de test tierce n'existe en amont d'un produit qui n'a pas encore été expédié.
Ce que ce changement signifie pour les investisseurs
Le coût du développement de puces sur les nœuds avancés — entre 200 millions et près d'un milliard de dollars en 3 nm et 2 nm, avec des délais de développement de trois à cinq ans — fait de ce changement un phénomène structurel, et non cyclique. Les hyperscalers qui ont déjà engagé des ressources d'ingénierie dans le silicium Arm sur mesure ne feront pas marche arrière. Le Graviton d'AWS, l'Axion de Google et le Cobalt de Microsoft représentent des investissements capitalistiques qui ne peuvent être redirigés sans conséquences sur plusieurs années.
Chaque point de pourcentage de part de calcul CPU qu'Arm capte au détriment du x86 représente un chiffre d'affaires déplacé dans un marché qui génère des centaines de milliards de dollars par an. Pour Intel et AMD, la question n'est plus de savoir si la suprématie du x86 dans les centres de données est contestée — elle est de savoir à quelle vitesse le terrain se dérobe, et si leurs feuilles de route en matière de performance par watt et de nœuds peuvent ralentir le rythme de l'érosion. Nvidia, quant à elle, a confirmé avoir sécurisé suffisamment de capacité chez TSMC pour soutenir sa croissance jusqu'en 2027, Huang déclarant que la société s'attend toujours à ce que l'offre reste tendue, la demande dépassant les ajouts de capacité.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.