La nueva serie de modelos V4 de DeepSeek reduce los costes de inferencia y admite un contexto de un millón de tokens, una combinación que podría acelerar el cambio de las empresas de simples chatbots a agentes de IA autónomos y complejos.
La empresa china de IA DeepSeek ha lanzado su serie de modelos V4, desafiando a sus rivales estadounidenses con un sistema que admite una ventana de contexto de un millón de tokens a unos costes que afirma son drásticamente reducidos. El lanzamiento intensifica la rivalidad en IA entre China y Estados Unidos, poco después de que la Casa Blanca acusara a entidades chinas de esfuerzos para robar tecnología de IA estadounidense.
"Esto aborda los problemas persistentes de rendimiento lento y altos costes asociados con las longitudes de contexto extensas, marcando un verdadero punto de inflexión para la industria", dijo Zhang Yi, fundador de la firma de investigación tecnológica iiMedia, a la AFP.
La nueva serie incluye dos versiones: el V4-Pro de 1,6 billones de parámetros para tareas complejas y el V4-Flash de 284.000 millones de parámetros, más económico. DeepSeek afirma que las capacidades de "conocimiento del mundo" del V4-Pro solo están por detrás del último modelo Gemini de Google. El sistema también está optimizado para ejecutarse en chips del gigante tecnológico chino Huawei, cuyos productos Ascend SuperPoD respaldan la serie V4.
Se espera que las mejoras de eficiencia aceleren la demanda en el sector de la IA Agéntica, según un informe de CICC. El banco de inversión declaró que es optimista respecto a los desarrolladores de modelos Zhipu (02513.HK) y MiniMax (00100.HK), creyendo que están posicionados para beneficiarse del avance tecnológico y del mercado en expansión para tareas de IA complejas y de largo plazo.
La arquitectura V4 apunta a resolver el problema del coste del contexto largo
La innovación principal de la serie V4 es un mecanismo de atención híbrido diseñado para reducir los costes computacionales y de memoria típicamente asociados con las ventanas de contexto grandes. Al optimizar los FLOPs de inferencia de un solo token y el uso de KV Cache, DeepSeek pretende que los modelos a escala de millones de tokens sean comercialmente viables para aplicaciones generales.
Este enfoque en la eficiencia se refleja en los precios de su API. Según las tarifas publicadas, el modelo DeepSeek V4 Pro tiene un precio de 1,74 $ por millón de tokens de entrada y 3,48 $ por salida. Esto lo posiciona competitivamente frente a otros modelos de alto rendimiento. En comparación, el MiMo-V2.5-Pro recientemente lanzado por Xiaomi tiene un precio de 1,00 $ para la entrada y 3,00 $ para la salida, mientras que el potente Claude Opus 4.7 de Anthropic cuesta significativamente más: 5,00 $ para la entrada y 25,00 $ para la salida.
La IA Agéntica y el Código Abierto alimentan la competencia
La estrategia de DeepSeek parece centrada en el creciente campo de la IA Agéntica. La empresa afirmó que su modelo V4 está optimizado para marcos de agentes de IA populares como OpenClaw y CodeBuddy, que permiten a la IA completar tareas complejas de forma autónoma en nombre de un usuario. Este segmento del mercado ha visto una competencia intensa, con modelos como el MiMo-V2.5-Pro de Xiaomi demostrando una alta eficiencia en las pruebas de referencia agénticas.
Parte de la estrategia de DeepSeek incluye hacer que sus sistemas sean de código abierto, en contraste con los modelos propietarios de OpenAI, Google y Anthropic. Este enfoque ha impulsado la adopción por parte de municipios y empresas chinas, pero también ha atraído el escrutinio. La Casa Blanca acusó recientemente a las firmas chinas de utilizar "campañas de destilación a escala industrial para robar la IA estadounidense", una afirmación que Pekín calificó de "infundada". El enfoque de código abierto de DeepSeek, combinado con sus afirmaciones de rendimiento y compatibilidad con el hardware nacional, marca un hito significativo en el esfuerzo de China por construir una industria de IA autosuficiente.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.