Groq augmente de 70% la commande de puces IA de Samsung pour Nvidia
La startup de puces IA Groq a demandé à Samsung Electronics d'augmenter sa production de puces IA d'environ 70%, passant de 9 000 à 15 000 plaquettes, selon un rapport du 10 mars citant des sources industrielles. Cette augmentation de la production fait passer la production de Groq de la phase d'échantillonnage à la phase de production de masse initiale. Cette demande intervient après l'acquisition indirecte de Groq par Nvidia en décembre pour environ 20 milliards de dollars, établissant un accord de licence technologique non exclusif plutôt que de prendre le contrôle direct. Cet arrangement permet à Nvidia d'orienter la fabrication et la direction stratégique de Groq pour servir son propre écosystème.
Nvidia cible le marché de l'inférence IA pour cimenter sa domination
La décision de Nvidia de s'appuyer sur Groq marque une entrée significative sur le marché de l'inférence IA, une expansion stratégique au-delà de sa domination établie dans les puces d'entraînement IA. Ce partenariat vise à développer du matériel spécialisé optimisé pour l'exécution de modèles IA, un segment aux exigences techniques différentes de celles de l'entraînement. Nvidia devrait annoncer une nouvelle puce basée sur les designs de Groq lors de sa conférence GTC 2026. Ce futur processeur pourrait utiliser de la SRAM au lieu de la mémoire HBM courante dans les puces d'entraînement, un choix de conception destiné à réduire considérablement la latence et la consommation d'énergie pour les applications d'inférence en temps réel.
Samsung équilibre le boom de l'IA et les obstacles de production en 2 nm
Bien que la commande de Groq donne à Samsung une position critique sur le marché croissant des puces d'inférence IA, son activité de fonderie est confrontée à des pressions de planification complexes sur ses lignes de production les plus avancées. Tesla a récemment retardé ses plans de production de plaquettes multiprojets (MPW) sur le processus 2 nm de Samsung, ce qui a à son tour reporté le calendrier de fabrication de la firme coréenne d'IA DeepX d'environ six mois. Malgré ces perturbations, Tesla négocierait également pour plus que doubler sa propre commande de puces AI6 en 2 nm, pour atteindre 40 000 plaquettes par mois. Cette dynamique illustre la demande intense pour les nœuds de pointe et les défis opérationnels auxquels Samsung est confrontée pour allouer sa capacité limitée entre des clients concurrents à enjeux élevés.