Los modelos de IA chinos ganan cuota de enrutamiento al reducir costes un 95% frente a EE.UU.

Los modelos de inteligencia artificial chinos están capturando una cuota creciente del tráfico de enrutamiento de inferencia, ya que sus costes de API representan una fracción de los de sus competidores estadounidenses, reconfigurando la economía del mercado de IA.

Los modelos de IA chinos de DeepSeek, Qwen de Alibaba y ByteDance están ganando una cuota creciente de las consultas de enrutamiento de modelos, a medida que los desarrolladores redirigen las cargas de trabajo no sensibles hacia el proveedor de inferencia más barato, amenazando el poder de fijación de precios de OpenAI, Anthropic y Google.

La tendencia fue destacada en un informe del 8 de junio de CNBC por Deirdre Bosa, que analizó cómo las plataformas de enrutamiento de modelos están dirigiendo cada vez más tráfico hacia proveedores chinos a medida que la brecha de costes se amplía en toda la industria.

El precio de la API de DeepSeek para su modelo V3 es de aproximadamente 0,14 dólares por millón de tokens de entrada, en comparación con los 2,50 dólares de GPT-4o de OpenAI, un descuento del 94%. Los modelos Qwen 2.5 de Alibaba y Doubao de ByteDance ofrecen ventajas de precio similares, convirtiéndose en la opción predeterminada para las plataformas de enrutamiento que optimizan en función del coste por encima de la capacidad bruta.

Este cambio amenaza los modelos de ingresos de los líderes estadounidenses de IA, que han construido sus negocios sobre precios premium de API. Se espera que solo OpenAI genere más de 10.000 millones de dólares en ingresos este año, gran parte de ellos provenientes del acceso a API. Si las plataformas de enrutamiento continúan desviando tráfico hacia proveedores chinos, las empresas estadounidenses podrían verse obligadas a recortar precios, comprimiendo los márgenes en toda la industria.

Cómo el enrutamiento de modelos reconfigura el mercado de inferencia

Plataformas de enrutamiento de modelos como OpenRouter y Together AI evalúan automáticamente las consultas entrantes y las dirigen hacia el modelo que ofrece el mejor equilibrio entre capacidad y coste. Para tareas como resúmenes, traducción y generación básica de código — que representan la mayor parte del volumen de inferencia — los modelos chinos ofrecen a menudo una calidad comparable a una fracción del precio. Esto crea una ventaja estructural para los proveedores chinos que los laboratorios estadounidenses no pueden contrarrestar fácilmente sin recortar sus propios precios.

Quién gana, quién pierde

Los mayores beneficiarios son los proveedores de infraestructura en la nube que admiten el enrutamiento multi-modelo, incluyendo AWS, Google Cloud y Alibaba Cloud, que obtienen ingresos por cómputo independientemente de qué modelo gane la decisión de enrutamiento. Nvidia también se beneficia del aumento de la demanda total de cómputo — cada consulta de inferencia sigue requiriendo ciclos de GPU, y las plataformas de enrutamiento impulsan una mayor utilización general.

Los mayores perdedores son los laboratorios de IA estadounidenses que han invertido miles de millones en entrenar modelos de frontera, pero que ahora enfrentan una guerra de precios que podrían tener dificultades para ganar. OpenAI ha recaudado más de 20.000 millones de dólares en financiación, gran parte de ella destinada a cómputo de entrenamiento y talento. Si las plataformas de enrutamiento mercantilizan la inferencia, la economía que justificaba esas inversiones comienza a desmoronarse.

Para los inversores, la pregunta clave es si las empresas de IA estadounidenses pueden mantener su poder de fijación de precios. OpenAI, Anthropic y DeepMind de Google han dependido de precios premium de API para financiar costosas ejecuciones de entrenamiento. El modelo V3 de DeepSeek fue entrenado por aproximadamente 6 millones de dólares en costes de cómputo, en comparación con los cientos de millones gastados en modelos estadounidenses comparables — una estructura de costes que permite a los proveedores chinos socavar los precios estadounidenses de forma indefinida. Los analistas de Morgan Stanley han señalado los precios de inferencia como un riesgo clave para las valoraciones de infraestructura de IA, señalando que una guerra de precios sostenida podría reducir los rendimientos proyectados sobre los 200.000 millones de dólares en CapEx de centros de datos de IA previstos hasta 2027.

Este artículo es solo con fines informativos y no constituye asesoramiento de inversión.