La brecha entre los modelos fronterizos de IA de China y EE. UU. se ha reducido a meses, no años, mientras que los sistemas de pesos abiertos de Zhipu y DeepSeek publican puntuaciones de referencia que rozan a los mejores modelos cerrados.
La brecha entre los modelos fronterizos de IA de China y EE. UU. se ha reducido a meses, no años, mientras que los sistemas de pesos abiertos de Zhipu y DeepSeek publican puntuaciones de referencia que rozan a los mejores modelos cerrados.

La brecha entre los modelos fronterizos de IA de China y EE. UU. se ha reducido a meses, no años, mientras que los sistemas de pesos abiertos de Zhipu y DeepSeek publican puntuaciones de referencia que rozan a los mejores modelos cerrados.
Elon Musk predijo que los modelos de lenguaje grandes de China podrían alcanzar la paridad con Fable de Anthropic en el primer trimestre de 2027, respondiendo a una publicación en redes sociales sobre el GLM-5.2 de Zhipu AI que acortaba la distancia. Demis Hassabis, director ejecutivo de Google DeepMind, también ha señalado que los modelos de IA chinos podrían estar "solo meses detrás" de sus contrapartes extranjeras, según comentarios previos citados por medios estatales chinos.
"Lo que destaca es la tasa de mejora", afirmó Rachel Kim, analista de Edgen que sigue la infraestructura de IA. "Los laboratorios chinos están comprimiendo en trimestres lo que solía tomar años, y lo están haciendo con silicio nacional".
Zhipu AI lanzó GLM-5.2 el 16 de junio bajo una licencia MIT, lo que lo hace disponible gratuitamente para uso comercial. El modelo obtiene 81.0 en Terminal-Bench 2.1, frente a 62.0 de GLM-5.1, un salto del 31 % en una sola versión. En SWE-bench Pro, alcanza 62.1, superando ligeramente a GPT-5.5, y se sitúa a un solo punto de Opus 4.8 de Anthropic en FrontierSWE. El modelo cuenta con una ventana de contexto de 1 millón de tokens y cuesta aproximadamente una sexta parte de lo que cobran los principales modelos cerrados estadounidenses por token.
El V4-Pro de DeepSeek, un modelo de mezcla de expertos de 1.6 billones de parámetros que activa 49 mil millones de parámetros por token, obtiene un 80.6 % en SWE-bench Verified. A aproximadamente 87 centavos por millón de tokens de salida, cuesta cerca de una treintava parte del precio de los modelos fronterizos. Los pesos son abiertos. La familia Qwen de Alibaba superó los 1.000 millones de descargas en Hugging Face en enero, sobrepasando a Llama de Meta como la familia de modelos abiertos más descargada del mundo.
Tres Lanzamientos en Cuatro Meses
El ritmo de los lanzamientos de modelos chinos demuestra la velocidad. GLM-5 llegó en febrero. GLM-5.1 le siguió en marzo, elevando su puntuación interna de codificación de 35.4 a 45.3, una mejora del 28 %. GLM-5.2 llegó en junio, casi duplicando nuevamente el resultado de Terminal-Bench. Cada paso se entrenó con silicio chino, con indicios de que toda la pila tecnológica está ahora libre de Nvidia.
En 2023, los modelos abiertos estaban dos años por detrás de la frontera cerrada. En 2024, esa brecha se redujo a un año. En 2025, a seis meses. Hoy, en los benchmarks que importan para el trabajo de ingeniería, la brecha se mide en semanas.
Hacia Dónde Va el Valor
A medida que los pesos de los modelos se aproximan a precios de commodity, la economía se desplaza hacia la inferencia y la infraestructura. La inferencia consume actualmente aproximadamente dos tercios de toda la computación de IA, frente a un tercio en 2023, según estimaciones del sector. Nebius Group informa que un cliente redujo sus costos de inferencia en 26 veces utilizando modelos abiertos en su plataforma. Cloudflare ahora sirve más de 70 modelos desde su red perimetral.
El director ejecutivo de Microsoft, Satya Nadella, enmarcó este cambio en un ensayo del 14 de junio, argumentando que las empresas deben construir tanto "capital humano" como "capital de tokens", es decir, la capacidad de IA que poseen en lugar de alquilar. Su advertencia al personal: evitar enrutar cada tarea a través de un modelo fronterizo costoso cuando un modelo especializado más barato sería suficiente.
Para los inversores, la reducción de la brecha plantea interrogantes sobre los 176 mil millones de dólares en posible depreciación subestimada en toda la industria de centros de datos que Michael Burry ha señalado. Si los modelos de grado fronterizo se ejecutan en un escritorio DGX Spark de 4.700 dólares, la máquina Grace Blackwell de Nvidia con 128 gigabytes de memoria unificada, la curva de demanda de inferencia centralizada que respalda los cronogramas de depreciación a cinco años podría crecer más lentamente de lo que suponen las hojas de cálculo. Aproximadamente la mitad de los centros de datos estadounidenses planificados para 2026 ya enfrentan retrasos o cancelaciones, y los mercados de predicción sitúan las probabilidades de una moratoria federal sobre los grandes incentivos para centros de datos antes de 2027 en aproximadamente una de cada tres.
Este artículo tiene fines exclusivamente informativos y no constituye asesoramiento de inversión.