Tencent está cambiando su estrategia de IA: de perseguir el conteo de parámetros a optimizar la ejecución de tareas del mundo real de manera rentable con su nuevo modelo de código abierto.
Atrás
Tencent está cambiando su estrategia de IA: de perseguir el conteo de parámetros a optimizar la ejecución de tareas del mundo real de manera rentable con su nuevo modelo de código abierto.

Tencent Holdings Ltd. presentó el 23 de abril su modelo de vista previa Hy3, un sistema de inteligencia artificial de código abierto con 295 mil millones de parámetros, lo que indica un giro estratégico hacia la eficiencia y la aplicación práctica por encima de la búsqueda de la escala pura. El lanzamiento representa un ajuste significativo para el gigante tecnológico chino, centrándose en la creación de un modelo rentable para tareas complejas del mundo real a medida que se intensifica la carrera nacional por la IA.
"La vista previa de Hy3 es el primer paso de la reconstrucción del modelo grande de Hunyuan", afirmó en un comunicado Yao Shunyuan, científico jefe de IA de Tencent y director de su división de modelos de lenguaje de gran tamaño. "Esperamos que este lanzamiento de código abierto obtenga comentarios reales de la comunidad y de los usuarios para ayudar a mejorar la practicidad de la versión oficial de Hy3".
El nuevo modelo utiliza una arquitectura de Mezcla de Expertos (MoE) con un total de 295 mil millones de parámetros, pero solo activa 21 mil millones para cualquier tarea dada, junto con una ventana de contexto de 256K. Este diseño tiene como objetivo equilibrar las capacidades de alta gama con menores costos operativos. Las pruebas internas muestran que el modelo ofrece una reducción del 54 por ciento en la latencia del primer token y una disminución del 47 por ciento en la duración de extremo a extremo en productos internos como los agentes de IA CodeBuddy y WorkBuddy, con una tasa de éxito superior al 99,99 por ciento.
La medida sugiere que Tencent apuesta a que una ingeniería superior y una integración profunda en su vasto ecosistema de productos pueden proporcionar una ventaja competitiva, incluso sin tener el modelo más grande de la industria. Esto se produce mientras Tencent y su rival Alibaba Group estarían en conversaciones para invertir en DeepSeek, una startup de IA que busca una valoración de más de 20 mil millones de dólares, lo que indica una estrategia dual de desarrollo interno mientras se invierte en tecnología de terceros prometedora.
El lanzamiento de Hy3 marca un cambio claro en la filosofía de IA de Tencent. La compañía ahora considera el rango de los 300 mil millones de parámetros como un punto de equilibrio óptimo, donde las capacidades principales como el razonamiento complejo y la comprensión de contextos largos se desbloquean por completo, y los aumentos adicionales de tamaño producen rendimientos decrecientes. Esto contrarresta el enfoque anterior de la industria en recuentos de parámetros cada vez mayores como la medida principal de la potencia de un modelo.
Este reajuste sigue a una reorganización de los equipos de IA de Tencent y al establecimiento de nueva infraestructura en febrero. El enfoque ahora está en los "Agentes de IA" que pueden ejecutar flujos de trabajo complejos, un concepto que el CEO de Tencent Cloud and Smart Industry, Tang Daosheng, ha calificado como el próximo paradigma. Al abrir el código de la vista previa de Hy3, Tencent pretende acelerar su evolución recopilando datos de uso del mundo real, refinando el modelo para su lanzamiento formal.
El enfoque pragmático de Tencent se sitúa en un contexto de intensa competencia y limitaciones de recursos. El alto costo de entrenar y escalar modelos se ve agravado por las restricciones de exportación de EE. UU. sobre semiconductores avanzados de empresas como Nvidia, lo que obliga a las firmas chinas a evaluar alternativas nacionales de proveedores como Huawei.
En este entorno, la eficiencia es primordial. DeepSeek, la startup que Tencent estaría cortejando, construyó su reputación desarrollando modelos potentes con una fracción del presupuesto utilizado por sus contrapartes occidentales. La búsqueda de Tencent de una participación en DeepSeek, mientras lanza simultáneamente su propio modelo Hy3 centrado en la eficiencia, destaca una estrategia de dos vertientes: desarrollar modelos internos potentes e integrados para su ecosistema, mientras se utilizan las inversiones para ganar exposición a otros innovadores y cubrirse contra callejones sin salida tecnológicos. El éxito de este enfoque dual será crítico para navegar el mercado de IA de China, que presenta desafíos únicos.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.