Intel, SambaNova et Foxconn construisent des racks prêts pour la production qui répartissent l'inférence IA sur trois architectures de puces.
Intel, SambaNova et Foxconn construisent des racks prêts pour la production qui répartissent l'inférence IA sur trois architectures de puces.

Intel, SambaNova et Foxconn construisent des racks prêts pour la production qui répartissent l'inférence IA sur trois architectures de puces.
Intel a présenté un système d'inférence découplée au Computex 2026 à Taipei lundi, qui sépare les phases de pré-remplissage et de décodage de l'inférence IA sur différents processeurs. Le système, alimenté par la plateforme de centre de données Vector Core Compute d'Intel et orchestré par ses processeurs Xeon 6, utilise le SN40 RDU de SambaNova pour le décodage et le GPU Blackwell de Nvidia pour le pré-remplissage. Foxconn, le plus grand fabricant mondial de produits électroniques, a fourni le support d'intégration système et a exposé des racks prêts pour la production au salon.
"Cette architecture permet aux clients d'optimiser chaque phase de l'inférence de manière indépendante, plutôt que de forcer l'ensemble du processus à travers un pipeline GPU unique", a déclaré un représentant d'Intel lors de l'événement. L'approche cible une inefficacité structurelle dans les déploiements IA actuels : le pré-remplissage — le premier passage computationally intensif qui traite la requête d'un utilisateur — et le décodage — la génération token par token d'une réponse — ont des exigences matérielles différentes qu'un seul type de puce ne peut satisfaire efficacement.
Le modèle découplé répond à un point de douleur croissant pour les entreprises qui exécutent des grands modèles de langage en production. Le pré-remplissage exige une bande passante mémoire élevée et des calculs matriciels, domaines où les GPU H100 et Blackwell de Nvidia excellent. Le décodage, en revanche, est plus sensible à la latence et bénéficie de l'architecture spécialisée de flux de données du RDU (unité de flux de données reconfigurable) de SambaNova. En répartissant la charge de travail, le Xeon 6 d'Intel agit comme orchestrateur, dirigeant chaque phase vers le processeur optimal.
Intel a également annoncé sa gamme de processeurs Xeon 6+ et des services cloud d'agents pour l'inférence découplée, renforçant ainsi sa poussée sur le marché des centres de données IA où Nvidia a capté environ 80 % des revenus des puces pour l'entraînement et l'inférence. Le partenariat avec SambaNova — une startup valorisée à plus de 5 milliards de dollars après son tour de financement en 2024 — et Foxconn donne à Intel un partenaire de fabrication et d'intégration capable de livrer des racks complets plutôt que de simples puces.
Le timing est stratégique. Nvidia a utilisé sa propre keynote au Computex lundi pour dévoiler le RTX Spark Superchip, son premier processeur PC grand public, et a confirmé que sa plateforme de centre de données Vera Rubin est entrée en pleine production. Le chiffre d'affaires de la division centres de données de Nvidia a atteint 35,6 milliards de dollars lors de son dernier trimestre fiscal, éclipsant celui du segment centres de données et IA d'Intel, qui a affiché 4,1 milliards de dollars. Mais le pari d'Intel sur l'inférence hétérogène — utilisant plusieurs types de puces pour une seule charge de travail — offre une proposition de valeur différenciée pour les entreprises qui souhaitent éviter un verrouillage total sur l'écosystème CUDA de Nvidia.
Pour les investisseurs, la question est de savoir si Intel peut convertir cette architecture en revenus. Le chiffre d'affaires des centres de données et de l'IA d'Intel a chuté de 8 % en glissement annuel au dernier trimestre, et l'entreprise a eu du mal à regagner les parts de marché perdues au profit de Nvidia et AMD dans le calcul IA. Le partenariat avec Foxconn offre une voie vers la production en volume : la capacité du fabricant sous-traitant à intégrer, tester et expédier des racks complets à grande échelle pourrait accélérer l'adoption par les entreprises. Les actions d'Intel ont gagné environ 200 % depuis le début de l'année, portées par l'optimisme suscité par son redressement, mais la société se négocie toujours avec une décote par rapport au multiple de 35x des bénéfices à terme de Nvidia.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.