Une crise de l'offre structurelle se propage dans la Silicon Valley alors que les géants du cloud comme Microsoft et Amazon privilégient leurs propres divisions d'IA et leurs clients de premier rang pour les GPU tant convoités de Nvidia Corp., laissant les startups financées par le capital-risque confrontées à une envolée des prix et à des délais d'attente de plusieurs années. Cette pression menace de freiner l'innovation et de consolider le pouvoir de l'IA, car l'accès au matériel informatique essentiel devient une fonction du bilan d'une startup plutôt que de sa technologie.
« Nous avons entendu dire par beaucoup que le calcul — spécifiquement l'accès aux GPU — est l'un des plus grands goulots d'étranglement cette année », a écrit Hemant Taneja, associé gérant chez General Catalyst, dans une enquête adressée aux fondateurs du portefeuille de sa firme. Ce sentiment a été partagé par des fondateurs de startups qui ont vu les prix de location des puces essentielles bondir de plus de 30 % en seulement six mois, les contrats à long terme devenant le seul moyen de garantir de la capacité.
La pénurie de l'offre s'est directement traduite par des coûts plus élevés et une incertitude opérationnelle pour les plus petits acteurs. La startup de génération d'images Krea, qui a levé 83 millions de dollars auprès d'investisseurs dont Andreessen Horowitz, a vu le prix de son contrat pour les GPU Nvidia Blackwell bondir de 32 % pour atteindre 3,70 $ par heure et par puce en seulement six mois. Pendant ce temps, l'unité cloud Azure de Microsoft a mis en place un système formel de niveaux, où les 1 000 premiers clients bénéficient d'un accès prioritaire, tandis que les entreprises plus petites du « Niveau 3 » font face à des attentes s'étendant jusqu'à fin 2026 et à des politiques révoquant l'accès aux serveurs inactifs.
Le goulot d'étranglement ne concerne pas seulement le prix, mais la disponibilité. Un fondateur cherchant un cluster de près de 1 000 GPU — une configuration qui coûterait plus de 70 000 $ par jour à louer — s'est vu répondre par le personnel de vente de Nvidia qu'il était extrêmement difficile de trouver un tel cluster chez un grand fournisseur de cloud. Cette rareté pousse certains, comme la startup d'agents IA Collide, à envisager un pivot intensif en capital : dépenser environ 500 000 $ pour acheter et exploiter ses propres GPU, un mouvement qui échange un coût initial plus élevé contre une certitude d'approvisionnement.
La Nouvelle Hiérarchie de l'Informatique
La stratégie d'allocation interne de Microsoft révèle un ordre de priorité clair. Un employé au fait du dossier a révélé qu'Azure divise ses clients en trois niveaux. Le Niveau 1 comprend environ 1 000 clients aux dépenses les plus élevées bénéficiant d'un accès prioritaire. Pour être éligible aux dernières puces Blackwell de Nvidia, les clients sont désormais tenus de s'engager sur au moins 1 000 puces pendant au moins un an, un contrat évalué en dizaines de millions de dollars.
Cette dynamique profite aux fournisseurs de cloud, dont les marges sur les locations de GPU s'améliorent après une période de pression. Cependant, elle crée un environnement difficile pour l'écosystème plus large de l'IA. La situation rappelle la pénurie de 2023, mais elle est aujourd'hui intensifiée par la demande explosive pour les assistants de codage IA et l'expiration de contrats cloud plus anciens et moins chers. Des sociétés de capital-risque comme Andreessen Horowitz et Index Ventures, qui avaient auparavant constitué leurs propres parcs de GPU pour soutenir leurs startups, voient l'histoire se répéter, mais avec des enjeux plus élevés.
Contourner le Cloud
La concurrence intense pour les GPU basés sur le cloud force les startups bien financées à une réévaluation stratégique. Collin McLelland, fondateur de la startup d'agents IA Collide, qui a levé 14 millions de dollars lors d'un tour de table d'amorçage, envisage l'achat de GPU pour éviter l'incertitude du marché de la location. « Le plus grand risque pour nous est de ne pas avoir de calcul quand nous en avons besoin », a déclaré McLelland. Bien que le coût initial soit substantiel, il le voit comme un investissement à long terme qui offre une protection contre les caprices de l'allocation des fournisseurs de cloud.
Cette tendance, si elle s'accélère, pourrait signaler un abandon partiel du modèle centré sur le cloud qui a dominé la dernière décennie des infrastructures technologiques. Bien qu'elle ne soit réalisable que pour un sous-ensemble de startups, le passage au matériel autogéré souligne la gravité des contraintes d'approvisionnement actuelles. Pour les fournisseurs de cloud, l'augmentation des bénéfices à court terme tirée des locations de GPU à prix élevé pourrait se faire au prix à long terme de pousser leurs clients les plus innovants vers l'indépendance.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.