La puce Jalapeño d'OpenAI défie Nvidia avec une réduction de 50 % des coûts d'inférence

OpenAI a dévoilé Jalapeño, un processeur d'inférence sur mesure conçu avec Broadcom, qui, selon la société, réduit les coûts d'exploitation d'environ 50 % par rapport aux GPU de Nvidia, menaçant ainsi la domination du fabricant de puces dans les centres de données d'IA.

« Le Jalapeño égalise les performances des puces Blackwell de Nvidia et des TPU de Google tout en réalisant l'inférence pour environ la moitié du coût », a déclaré Hock Tan, PDG de Broadcom, dans un entretien.

L'ASIC associe une vaste section de calcul à six piles de mémoire à large bande passante pour accélérer le transfert de données à travers les grands modèles de langage. Les premiers tests montrent des performances par watt « sensiblement meilleures » que les alternatives actuelles, a indiqué OpenAI, bien que la société n'ait pas divulgué le nœud de gravure, les fréquences d'horloge ni la configuration mémoire. La puce devrait être déployée d'ici la fin 2026.

Cette décision marque le premier pas d'OpenAI vers un éloignement de sa dépendance exclusive aux GPU rares de Nvidia. Les coûts d'inférence sont la facture récurrente qui croît avec le succès — chaque requête ChatGPT, chaque étape d'un agent Codex — et une puce optimisée uniquement pour cette tâche peut éliminer les mécanismes qu'un processeur généraliste doit embarquer. Pour une entreprise servant des modèles au volume d'OpenAI, réduire de moitié les coûts d'inférence transforme l'économie de l'activité.

Broadcom, assise sous chaque puce sur mesure

Le partenariat révèle une dynamique plus profonde. OpenAI, Google et Meta conçoivent tous leurs puces IA sur mesure à partir de l'architecture de Broadcom, transformant une compétition bruyante entre modèles de pointe en revenus stables pour la société qui se trouve sous tous. Broadcom a déclaré 8,4 milliards de dollars de revenus de puces IA au premier trimestre de l'exercice 2026, en hausse de 106 % par rapport à l'année précédente, et détient un carnet de commandes fermes de 73 milliards de dollars, lié à une trajectoire vers 100 milliards de dollars de revenus annuels de puces IA d'ici 2027, selon la direction.

Co-concevoir une puce signifie des années d'ingénierie partagée, de propriété intellectuelle et de feuilles de route matérielles qui lient le laboratoire et le concepteur bien après l'expédition des premières pièces. Google a commencé à concevoir ses propres puces IA il y a environ une décennie et n'a atteint cette année que sa septième génération, Ironwood, son premier TPU spécifiquement conçu pour l'inférence. Jalapeño est la première génération de ce qu'OpenAI appelle une « plateforme de calcul multi-générationnelle ».

Conséquences pour Nvidia et la chaîne d'approvisionnement

Les fournisseurs commerciaux ne disparaissent pas. Les premières séries de production couvrent rarement l'intégralité de la demande d'une entreprise, ce qui signifie qu'OpenAI continuera d'acheter des puces d'inférence auprès de fournisseurs externes pendant la montée en puissance du Jalapeño. Nvidia domine toujours les charges de travail d'entraînement, où le pré-entraînement intensif en performances continuera probablement de reposer sur son matériel dans un avenir prévisible.

La contrainte sur l'ensemble de ce processus est la fabrication. Chacune de ces puces dépend de Taiwan Semiconductor pour la gravure avancée et le packaging spécialisé qui lie le calcul et la mémoire en un seul composant fonctionnel. Cette capacité de packaging est vendue jusqu'en 2026, et la demande dans l'ensemble du secteur dépasse largement l'offre. OpenAI ne peut pas passer devant la file d'attente — elle rivalise pour une allocation limitée aux côtés de chaque grande entreprise technologique.

Les actions Nvidia, qui se négocient à environ 35 fois les bénéfices à terme, font face à un changement de récit à long terme alors que chaque grand laboratoire d'IA construit son propre silicium. Mais l'impact immédiat sur les revenus se situe à des années. Le bénéficiaire le plus clair est Broadcom, dont l'architecture se retrouve à l'intérieur des programmes sur mesure de trois des plus grandes entreprises d'IA à la fois. Les noms sur les puces continueront de changer. La société qui les conçoit reste la même.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.