La era de la IA barata e ilimitada está llegando a su fin — y surge un mercado de dos niveles para la inteligencia.
El director ejecutivo de Coinbase, Brian Armstrong, predijo que el 80 % de las cargas de trabajo de inteligencia artificial migrarán a modelos que cuestan un 99 % menos que los sistemas frontera actuales en un plazo de 12 a 18 meses, a medida que la industria se enfrenta a la insostenibilidad de los precios subvencionados.
"El factor limitante será la energía y la capacidad de cómputo, no mejores modelos", escribió Armstrong en X el domingo, respondiendo a una publicación del inversor Tommy Shaughnessy que describía cómo la facturación medida de las API está llevando el gasto empresarial en IA mucho más allá de lo que las suscripciones de tarifa plana llevaban a las empresas a esperar. Armstrong dijo que Coinbase ya está direccionando las consultas hacia modelos más baratos cuando corresponde, manteniendo sus costos de IA "aproximadamente planos" incluso mientras el uso de tokens crece exponencialmente.
El pronóstico del CEO de Coinbase llega días después de que Microsoft GitHub Copilot cambiara de una suscripción plana a una facturación basada en tokens el 1 de junio, lo que provocó aumentos en las facturas de hasta un 1700 % para algunos usuarios. Un suscriptor publicó una estimación de costos interna que mostraba su tarifa mensual saltando de $44.68 a $754.29, mientras que otro proyectaba una factura de $847. Esta revisión de precios refleja un ajuste de cuentas más amplio: el margen operativo de OpenAI se acerca al -122 %, según Shaughnessy, lo que significa que la empresa depende completamente del capital externo para subvencionar las compras de GPU y los costos de inferencia.
El mercado de inteligencia de dos niveles
El marco de Armstrong divide el uso de la IA en dos categorías. El 20 % restante de las cargas de trabajo que requieren el máximo rendimiento — investigación científica, orquestación de agentes y lo que denominó "maximización del coeficiente intelectual" — continuará ejecutándose en modelos frontera como Anthropic Opus 4.8 o OpenAI GPT-5.5. El otro 80 % se trasladará a alternativas más baratas, una dinámica que comparó con el hardware de consumo, donde la mayoría de los compradores evitan las especificaciones máximas en MacBooks y PC para gaming.
La economía ya respalda esta divergencia. DeepSeek V4 ofrece un rendimiento cercano al de Anthropic Claude Opus en el benchmark de codificación SWE-bench a aproximadamente una trigésima parte del costo, según Shaughnessy. El director ejecutivo de Hugging Face, Clement Delangue, citó una investigación de Stanford que muestra que la precisión de los modelos locales en consultas y razonamiento conversacional del mundo real aumentó al 71.3 % desde el 23.2 % en 2023, con una fracción de la energía y el costo de las llamadas API.
El CEO de Box, Aaron Levie, calificó la cifra del 99 % de Armstrong como "un poco extrema", pero coincidió en que el uso de la IA se estratificará, con el trabajo de alta gama para los modelos líderes y las tareas de alto volumen para los baratos. "La asignación de inteligencia va a ser extremadamente importante", escribió el cofundador de Harvey, Winston Weinberg. El cofundador de Glean, Tony Gentilcore, calificó el análisis de Armstrong como "acertado", añadiendo que "los mercados financieros son los únicos que extrapolan los precios de Opus a escala infinita".
El ángulo de inversión
El cambio hacia modelos más baratos amenaza los modelos de ingresos de los proveedores premium de IA, incluidos OpenAI, Microsoft y Anthropic, que han dependido de suscripciones subvencionadas para ganar participación de mercado. Si el 80 % de las cargas de trabajo migra a alternativas de bajo costo, el mercado direccionable para los modelos frontera se reduce drásticamente. Las empresas que permiten una inferencia rentable — incluidos los proveedores de modelos de código abierto y la infraestructura de enrutamiento — se beneficiarán. Nvidia, cuyas GPU H100 y B200 alimentan la mayor parte del entrenamiento de modelos frontera, enfrenta un panorama más complejo: la demanda de cómputo puede crecer, pero el poder de fijación de precios podría erosionarse a medida que proliferan las alternativas más baratas.
Este artículo es solo con fines informativos y no constituye asesoramiento de inversión.