La paradoja de precios de la IA: los costos de hardware upstream se disparan mientras los precios de los tokens downstream se desploman — y ambas tendencias se aceleran.
La paradoja de precios de la IA: los costos de hardware upstream se disparan mientras los precios de los tokens downstream se desploman — y ambas tendencias se aceleran.

La industria de la inteligencia artificial está experimentando una rara división estructural de precios: los costos de hardware upstream se están disparando mientras los precios de los tokens downstream se desploman, y ambas tendencias se aceleran en la primera mitad de 2026.
"La cadena industrial de la IA está experimentando una divergencia estructural de precios: los precios de los recursos informáticos upstream enfrentan inflación impulsada por la oferta, mientras que los precios de consumo de tokens downstream enfrentan deflación competitiva", escribió Zhang Xia, estratega de China Merchants Securities, en un informe del 15 de junio.
La divergencia es marcada. El hexafluoruro de tungsteno, un material clave para el grabado de semiconductores, se ha disparado a 1,670-1,810 yuanes por kilogramo, un aumento del 232.7% desde los 523 yuanes de hace un año, después de que proveedores surcoreanos notificaran a Samsung y SK Hynix aumentos de precios contractuales del 70% al 90% para 2026. El almacenamiento, las CPU y los módulos ópticos también extienden su tendencia alcista a medida que se acelera el gasto de capital de los hiperescaladores — proyectado para alcanzar los 757 mil millones de dólares en 2026 y 920 mil millones en 2027, frente a los 448 mil millones en 2025, según estimaciones de la industria.
La pregunta que ahora se hacen los inversores: ¿puede el creciente volumen de consumo de tokens compensar las caídas de precios lo suficiente como para sostener el crecimiento de los ingresos en toda la industria?
Las restricciones de oferta impulsan la inflación upstream
El aumento de precios upstream se remonta directamente a un desequilibrio entre oferta y demanda que no muestra señales de alivio. El gasto de capital de los hiperescaladores se ha más que cuadruplicado, pasando de 162 mil millones de dólares en 2022 a un proyectado de 757 mil millones en 2026, pero la capacidad de producción upstream tarda años en ponerse en marcha. Samsung y SK Hynix dijeron en sus llamadas de resultados de abril-mayo de 2026 que la escasez de memoria impulsada por la IA persistirá hasta 2027 y más allá, y que los clientes principales ya están asegurando capacidad para 2027.
El plan de infraestructura de datos de 2 billones de yuanes de China, anunciado en enero de 2025, añade otra capa de demanda. El plan exige que al menos el 80% de los chips de IA provengan de proveedores nacionales como Huawei y Cambricon, excluyendo a Nvidia y AMD. De la inversión total, alrededor de 780 mil millones de yuanes — o el 39% — se destinarán a chips GPU, lo que lo convierte en el mayor beneficiario individual. Los equipos de energía y distribución eléctrica representan el 21%, o 420 mil millones de yuanes, mientras que los módulos ópticos, interruptores y refrigeración toman cada uno alrededor del 4%.
Los fabricantes de chips nacionales ya están ganando terreno. La cuota de mercado de chips de IA en China superó el 52% en la primera mitad de 2026, frente al 41% en 2025 y superando a Nvidia por primera vez. La serie Ascend de Huawei lideró con 812,000 unidades enviadas en 2025, casi la mitad de todos los envíos de chips nacionales, seguida por Pingtouge de Alibaba con 265,000 unidades y Baidu Kunlun y Cambricon con aproximadamente 116,000 cada una.
La deflación de tokens se encuentra con la paradoja de Jevons
Downstream, el panorama de precios no podría ser más diferente. OpenAI está considerando recortes significativos en los precios de los tokens para contrarrestar la agresiva estrategia de precios de Anthropic, mientras que Tencent Cloud ya ha reducido los precios de entrada en un 66.67%. Claude Fable 5 de Anthropic, lanzado el 9 de junio, supera a todos los modelos públicos anteriores en tareas complejas de contexto largo, y sin embargo, tiene un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida — menos de la mitad del costo de su predecesor Mythos Preview.
El Índice de Gasto en Tokens LLM de Silicon Data, que rastrea el gasto total en tokens del mercado, mostró su primera caída notable desde febrero, ya que las empresas retrasaron sus compras anticipando nuevas bajas de precios.
Pero el consumo total está explotando. Las llamadas semanales globales de tokens alcanzaron los 36.1 billones al 8 de junio, según datos de OpenRouter, y continúan creciendo exponencialmente. En China, los usuarios de IA generativa pasaron de 249 millones a finales de 2024 a 515 millones a mediados de 2025 — aproximadamente duplicándose — mientras que el consumo diario de tokens se disparó de unos 100 mil millones a 1.4 billones en el mismo período, un aumento de 14 veces. La brecha entre el crecimiento de usuarios y el crecimiento del consumo sugiere que el motor no son los nuevos usuarios, sino una mayor profundidad de participación por usuario y la rápida penetración de aplicaciones basadas en agentes.
Esta es la paradoja de Jevons en acción: a medida que el costo de un recurso disminuye, la demanda total aumenta — a menudo lo suficiente como para incrementar el gasto total. Ocurrió con el carbón, la electricidad y el ancho de banda. La pregunta es si la economía de los tokens seguirá el mismo patrón.
Implicaciones para la inversión
Para los inversores, la divergencia crea dos oportunidades de negociación distintas. Los proveedores de hardware upstream — fabricantes de chips, productores de memoria, fabricantes de módulos ópticos y proveedores de equipos eléctricos — se benefician de restricciones estructurales de oferta y una demanda impulsada por políticas que probablemente persistirán al menos hasta 2027. El plan de infraestructura china de 2 billones de yuanes que favorece a los chips nacionales frente a Nvidia y AMD es una tendencia secular plurianual que redefine la dinámica competitiva en el segundo mercado de IA más grande del mundo.
Downstream, el panorama es más matizado. Las empresas que puedan capturar el volumen explosivo de tokens — proveedores de modelos como DeepSeek y Hunyuan de Tencent, que se encuentran entre los modelos más utilizados a nivel mundial — pueden compensar la compresión de precios mediante la escala. Los modelos de código abierto ahora representan casi un tercio del uso total de tokens, y los desarrolladores están sustituyendo DeepSeek y Qwen de Alibaba por algunas API de código cerrado.
Los sectores de energía y almacenamiento también emergen como beneficiarios indirectos. Los centros de datos de IA en China consumieron 196 mil millones de kilovatios-hora en 2025, y la Administración Nacional de Energía proyecta que esa cifra alcanzará los 800 mil millones de kilovatios-hora para 2030, o aproximadamente el 6% del consumo total de electricidad nacional. La capacidad instalada de almacenamiento de energía alcanzó los 136 millones de kilovatios a finales de 2025, un aumento interanual del 84%, y la infraestructura de IA se está convirtiendo en un nuevo motor significativo de demanda.
El riesgo clave es si el crecimiento de la demanda de tokens downstream puede mantener su trayectoria exponencial. Si la paradoja de Jevons se cumple, los ingresos totales de la industria crecen. Si las caídas de precios superan el crecimiento del volumen, los márgenes de la capa de aplicación enfrentan una presión sostenida. Los próximos dos trimestres de resultados de los hiperescaladores proporcionarán la primera prueba real.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.