Z Squared Inc. planea construir 100 megavatios de capacidad de centros de datos preparados para IA en los próximos 18 meses, apuntando al mercado cada vez más costoso de las cargas de trabajo de inferencia de IA, actualmente dominado por las nubes públicas. El movimiento, anunciado el martes, posiciona a la empresa de infraestructura digital para capitalizar a las firmas que buscan alternativas a los precios impredecibles basados en tokens para ejecutar sus modelos.
"La compañía anunció el destino de la Fase 1 de su estrategia, que incluye el objetivo de alcanzar 100 megavatios (MW) de capacidad preparada para IA disponible para contratos con clientes, en múltiples sitios de EE. UU. durante los próximos 18 meses", afirmó Z Squared en un comunicado. El monto de la inversión para el proyecto no fue revelado.
El despliegue de 100 MW está diseñado específicamente para la inferencia, el proceso de ejecutar modelos de IA entrenados para generar respuestas, que se ha convertido en un costo operativo importante. Un solo desarrollador que utilice un sistema de IA de agentes puede consumir mil millones de tokens en 24 horas, con un costo estimado de 3.400 $ en una nube pública, según cifras recientes de Dell Technologies.
Z Squared (NASDAQ: ZSQR) apuesta a que una parte significativa de estas cargas de trabajo de IA se desplazará a infraestructura especializada de costo fijo para escapar de tales costos elevados. Este giro la sitúa en competencia con hiperescaladores como Amazon Web Services y Microsoft Azure, con el objetivo de capturar una porción del mercado de infraestructura de IA en rápida expansión antes de que madure por completo.
La economía de la inferencia de IA
El impulso hacia una infraestructura de IA alternativa surge de la economía punitiva de los flujos de trabajo de agentes. A diferencia de los simples chatbots, los agentes de IA que pueden ejecutarse de forma autónoma y reintentar acciones fallidas consumen tokens a un ritmo que convierte la facturación en la nube pública en un riesgo financiero significativo para las empresas. Dell, por ejemplo, estima que sus sistemas de IA locales pueden reducir ese gasto hasta en un 87% en dos años en comparación con las soluciones puramente en la nube.
La estrategia de Z Squared es una respuesta directa a esta apertura del mercado. Al ofrecer capacidad dedicada para la inferencia, la empresa proporciona un modelo de gastos operativos predecibles, lo cual es atractivo para las empresas que escalan sus aplicaciones de IA. El enfoque en la inferencia es crítico, ya que representa la mayor parte de la demanda computacional de IA una vez que un modelo se entrena y despliega.
Un campo de infraestructura saturado
Z Squared entra en un escenario competitivo donde los principales actores tecnológicos ya están estableciendo sus posiciones. Dell se ha convertido en un canal de distribución clave para la IA local, forjando alianzas para desplegar los modelos de OpenAI, Gemini 1.5 Flash de Google y la plataforma Foundry de Palantir directamente en el hardware propiedad del cliente.
Esto convierte al mercado de infraestructura preparada para IA en un campo de batalla disputado por proveedores de hardware tradicionales como Hewlett Packard Enterprise y Supermicro, y los propios hiperescaladores. AWS de Amazon y Azure de Microsoft están ampliando sus propias ofertas de nube híbrida para mantener las cargas de trabajo empresariales dentro de sus ecosistemas. El éxito de Z Squared dependerá de su capacidad para construir rápidamente su capacidad de 100 MW y asegurar clientes que prioricen la previsibilidad de costos sobre los servicios integrados de las grandes plataformas en la nube.
Este artículo tiene únicamente fines informativos y no constituye asesoramiento de inversión.