La course aux armements dans l'IA ne se concentre plus seulement sur les GPU mais se déplace vers le processeur (CPU), longtemps négligé, alors que l'essor des charges de travail complexes d'IA agentique menace de modifier l'architecture fondamentale des centres de données. Le ratio CPU-GPU requis devrait désormais passer d'une fourchette de 1:4 à 1:8 à un ratio aussi serré que 1:1, créant un goulot d'étranglement de production sévère pour un composant qui était auparavant secondaire.
« Le CPU fait face à une pénurie de capacité extrêmement grave », a déclaré Dylan Patel, analyste en chef chez SemiAnalysis, lors d'une interview en avril. Il a noté que le paradigme des charges de travail d'IA évolue de la simple génération de texte vers des tâches complexes en plusieurs étapes coordonnées par des agents d'IA, un processus qui dépend intensément du CPU.
Le cabinet d'études de marché TrendForce a confirmé ce jugement dans un rapport récent, projetant que le ratio CPU-GPU se réduirait entre 1:1 et 1:2 à l'ère de l'IA agentique. Dans ces nouvelles charges de travail, le CPU gère la « couche d'orchestration » — planification des tâches, appel des outils et gestion du flux de données entre les modèles. Un article académique de 2025, « A CPU-Centric Perspective on Agentic AI », a révélé que le traitement des outils basé sur le CPU peut représenter jusqu'à 90,6 % de la latence totale dans les tâches agentiques. Arm calcule que cela se traduit par une multiplication par quatre de la demande, passant de 30 millions de cœurs CPU par gigawatt dans les centres de données d'IA traditionnels à 120 millions de cœurs pour l'IA agentique.
Ce choc structurel de la demande redessine le paysage concurrentiel, exerçant une pression immense sur la dominance historique d'Intel tout en créant des opportunités de croissance massives pour AMD et les nouveaux entrants Nvidia et Arm. Pour les investisseurs, cela ouvre de nouveaux vecteurs pour capitaliser sur la construction de l'infrastructure d'IA au-delà du commerce bien établi des GPU.
Le changement a d'abord déstabilisé le marché traditionnel du x86. Intel, dont les processeurs Xeon détenaient plus de 95 % du marché des serveurs, a vu sa position s'éroder après que des problèmes de rendement sur son procédé 7nm ont retardé la puce Sapphire Rapids de près de deux ans, ouvrant la porte à l'EPYC Milan d'AMD. La feuille de route 2026 d'Intel, incluant le Xeon 6+ à 288 cœurs et le Xeon 7 à 256 cœurs, repose sur son nœud de gravure 18A encore non prouvé. TrendForce rapporte que les problèmes de rendement pourraient retarder la production de masse de ces puces jusqu'en 2027, permettant probablement à AMD de continuer à gagner des parts de marché avec son EPYC Venice à 256 cœurs/512 threads, fabriqué sur le procédé N2 de TSMC.
Le changement le plus significatif est l'entrée de joueurs non traditionnels. En mars 2026, le géant des GPU Nvidia a annoncé qu'il vendrait son CPU Vera en tant que produit autonome. La puce, basée sur le procédé N3 de TSMC, dispose de 88 cœurs et peut être directement liée aux GPU de Nvidia via son interconnexion NVLink-C2C. Le même mois, Arm a mis fin à ses 35 ans d'histoire en tant que simple concédant de licences IP en annonçant son propre CPU, l'Arm AGI. La puce de 136 cœurs, également sur le procédé N3 de TSMC, a déjà remporté des contrats de conception avec Meta, OpenAI et Microsoft. Les fournisseurs de cloud accélèrent également leurs conceptions de CPU internes, avec le Graviton5 d'AWS, le Cobalt 200 de Microsoft et l'Axion de Google, tous visant la réduction des coûts pour les charges de travail d'IA.
L'augmentation de la demande de CPU crée un nouveau vecteur d'investissement sous-estimé au-delà des GPU. Alors qu'Intel (INTC) fait face à un risque d'exécution significatif sur son procédé 18A, AMD (AMD) est positionné pour continuer ses gains de parts de marché. L'entrée de Nvidia (NVDA) et d'Arm (ARM) ouvre de nouvelles sources de revenus de plusieurs milliards de dollars pour les deux sociétés. Cette expansion des concepteurs de CPU non traditionnels profite également directement aux entreprises de services backend IC comme Global Unichip Corp. (GUC), qui gère la conception pour Google et Microsoft, et à l'écosystème plus large de packaging avancé de TSMC.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.