Z Squared Inc. prévoit de construire 100 mégawatts de capacité de centre de données prête pour l'IA au cours des 18 prochains mois, ciblant le marché de plus en plus coûteux des charges de travail d'inférence IA, actuellement dominé par les clouds publics. Cette initiative, annoncée mardi, positionne l'entreprise d'infrastructure numérique pour capitaliser sur les sociétés cherchant des alternatives à la tarification imprévisible basée sur les jetons pour l'exécution de leurs modèles.
« La société a annoncé l'objectif de la phase 1 de sa stratégie, qui comprend l'atteinte de 100 mégawatts (MW) de capacité prête pour l'IA disponible pour les contrats clients, sur plusieurs sites américains au cours des 18 prochains mois », a déclaré Z Squared dans un communiqué. Le montant de l'investissement pour le projet n'a pas été divulgué.
Le déploiement de 100 MW est spécifiquement conçu pour l'inférence, le processus d'exécution de modèles d'IA entraînés pour générer des réponses, qui est devenu un coût opérationnel majeur. Un seul développeur utilisant un système d'IA agentique peut consommer un milliard de jetons en 24 heures, pour un coût estimé à 3 400 $ sur un cloud public, selon des chiffres récents de Dell Technologies.
Z Squared (NASDAQ: ZSQR) parie qu'une part importante de ces charges de travail d'IA se déplacera vers une infrastructure spécialisée à coût fixe pour échapper à ces coûts élevés. Ce pivot place l'entreprise en concurrence avec les géants du cloud comme Amazon Web Services et Microsoft Azure, visant à capturer une part du marché de l'infrastructure IA en expansion rapide avant qu'il ne soit pleinement mature.
L'économie de l'inférence IA
La poussée vers une infrastructure IA alternative découle de l'économie punitive des flux de travail agentiques. Contrairement aux simples chatbots, les agents IA qui peuvent fonctionner de manière autonome et réessayer des actions ayant échoué consomment des jetons à un rythme qui fait de la facturation sur le cloud public un risque financier important pour les entreprises. Dell, par exemple, estime que ses systèmes d'IA sur site peuvent réduire ces dépenses jusqu'à 87 % sur deux ans par rapport aux solutions purement cloud.
La stratégie de Z Squared est une réponse directe à cette ouverture du marché. En offrant une capacité dédiée à l'inférence, la société propose un modèle de dépenses opérationnelles prévisibles, ce qui est attrayant pour les entreprises qui font évoluer leurs applications d'IA. L'accent mis sur l'inférence est critique, car elle représente l'essentiel de la demande de calcul IA une fois qu'un modèle est entraîné et déployé.
Un domaine d'infrastructure encombré
Z Squared entre dans une arène compétitive où les grands acteurs technologiques établissent déjà leurs positions. Dell est devenu un canal de distribution clé pour l'IA sur site, forgeant des partenariats pour déployer les modèles d'OpenAI, Gemini 1.5 Flash de Google et la plateforme Foundry de Palantir directement sur le matériel appartenant aux clients.
Cela fait du marché de l'infrastructure prête pour l'IA un champ de bataille disputé par les fournisseurs de matériel traditionnels comme Hewlett Packard Enterprise et Supermicro, et les géants du cloud eux-mêmes. AWS d'Amazon et Azure de Microsoft étendent leurs propres offres de cloud hybride pour maintenir les charges de travail des entreprises au sein de leurs écosystèmes. Le succès de Z Squared dépendra de sa capacité à construire rapidement sa capacité de 100 MW et à sécuriser des clients qui privilégient la prévisibilité des coûts aux services intégrés des grandes plateformes cloud.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.