La era del consumo ilimitado de tokens de IA dentro de las empresas Fortune 500 está terminando, reemplazada por presupuestos estrictos, límites de uso y una búsqueda frenética de modelos más baratos, ya que los costes por empleado alcanzan los $7,500 al mes.
AT&T ha restringido el acceso de sus empleados a GitHub Copilot de Microsoft. Meta endureció el gasto en Anthropic y otros servicios de IA. Uber agotó todo su presupuesto de codificación con IA para 2026 en abril y limitó a cada trabajador a $1,500 por herramienta al mes. Walmart estableció límites en sus agentes de IA internos. Amazon abolió el ranking interno que clasificaba a los empleados por su uso de IA — tras descubrir que los trabajadores consumían capacidad de cómputo solo para escalar posiciones.
El giro del "tokenmaxxing" — la práctica de maximizar el consumo de tokens de IA — al "tokenminimizing" se extiende entre los mayores usuarios corporativos de IA generativa, según personas familiarizadas con el asunto. En las empresas más intensivas en IA, los costes mensuales de IA por empleado han alcanzado los $7,500, informó The Information, una cifra que ha obligado a los directores financieros a intervenir.
"Las empresas se están dando cuenta de que los flujos de trabajo de IA agéntica no escalan con tarifas planas", dijo Alex Nguyen, analista de IA empresarial en Edgen. "Cuando un solo agente de IA puede encadenar 50 llamadas a modelos para completar una tarea, las matemáticas se rompen a volumen empresarial".
El problema matemático de los $7,500 por empleado
El cambio estructural se remonta al auge de las herramientas de IA agéntica — software que encadena de forma autónoma múltiples llamadas a modelos para completar tareas complejas en correos electrónicos, hojas de cálculo y aplicaciones de mensajería. A diferencia de las consultas manuales a chatbots, estos agentes consumen tokens en ráfagas difíciles de predecir o limitar.
Microsoft descubrió que algunos ingenieros gastaban entre $500 y $2,000 al mes solo en tarifas de tokens de Claude Code, según datos internos revisados por la compañía. Los costes de interacción con IA empresarial se han multiplicado por 30 desde 2023, y Goldman Sachs proyecta que los flujos de trabajo agénticos podrían multiplicar la demanda de tokens por 24 respecto a los niveles actuales.
La brecha de precios entre los modelos premium y los de código abierto agudiza la tensión. El último modelo insignia de Anthropic cuesta aproximadamente $50 por millón de tokens, mientras que DeepSeek V4 Pro funciona a unos $0.87 por millón de tokens — una diferencia de 57 veces, según los datos de precios publicados por ambas compañías. Microsoft está explorando ahora una versión ajustada y autoalojada de DeepSeek V4 como un backend de menor coste para su producto Copilot Cowork, informó Axios el 16 de junio.
No todas las empresas están ajustando el gasto. Databricks no impone ningún límite presupuestario de IA a sus ingenieros, declaró el líder de ingeniería Nikita Shamgunov en un evento de Nebius la semana pasada. El consejero delegado de Box, Aaron Levie, dijo que su empresa nunca adoptó el tokenmaxxing. "No teníamos un ranking, así que no nos desviamos", afirmó Levie.
Los guardianes de la nueva era de presupuestos de IA
La ola de control de costes está creando una nueva capa de demanda de infraestructura. Microsoft y Databricks han lanzado herramientas de "puerta de enlace" que monitorizan el uso de IA por parte de los empleados y aplican límites de gasto. Factory, respaldada por Nvidia y valorada en $1,500 millones, lanzó este mes un enrutador de modelos que asigna automáticamente tareas de baja complejidad a modelos más baratos.
Ejecutivos de Palantir y Box reportan una creciente demanda por parte de clientes empresariales que buscan trasladar tareas simples de modelos frontera caros a alternativas más baratas o de código abierto. El patrón refleja el cambio de la computación en la nube totalmente premium a la escalonada que transformó el mercado de la nube pública hace una década.
El consejero delegado de Microsoft, Satya Nadella, enmarcó la tendencia como una necesidad estratégica. "Ninguno de nosotros quiere ver un mundo donde cada empresa en cada industria ceda valor a un puñado de modelos de 'el ganador se lo lleva todo'", escribió en X la semana pasada. El comentario tiene peso dado que el propio software de productividad de Microsoft compite ahora con Anthropic y OpenAI en precios.
El nuevo producto Copilot Cowork de Microsoft, que estuvo disponible de forma general el 16 de junio, encarna la tensión. Requiere una licencia de Microsoft 365 Copilot de $30 por usuario al mes más cargos adicionales basados en el uso a través de Copilot Credits — un modelo de suscripción dual más consumo que refleja los precios empresariales de Anthropic. El vicepresidente ejecutivo de Microsoft, Charles Lamanna, dijo que los clientes "pueden elegir cómo gestionar los costes", incluyendo el establecimiento de límites de uso por empleado y el intercambio de modelos de Anthropic por OpenAI o las alternativas propias de Microsoft.
La pregunta para los inversores es si los controles de costes amortiguarán las ganancias de productividad que justificaron el gasto empresarial en IA en primer lugar. Las acciones de Microsoft cotizan a 33 veces las ganancias futuras, siendo el crecimiento de los ingresos relacionados con la IA un pilar clave de la tesis alcista. Si la limitación de tokens frena la adopción, las previsiones de ingresos incorporadas en las valoraciones actuales podrían resultar optimistas. Por ahora, los directores financieros tienen la sartén por el mango.
Este artículo es únicamente con fines informativos y no constituye asesoramiento de inversión.