El nuevo modelo de prueba Hunyuan Hy3 de Tencent, con 295 mil millones de parámetros, entra en el competitivo panorama de la IA, centrándose en aplicaciones empresariales prácticas y rentabilidad para desafiar a los actores establecidos.
Atrás
El nuevo modelo de prueba Hunyuan Hy3 de Tencent, con 295 mil millones de parámetros, entra en el competitivo panorama de la IA, centrándose en aplicaciones empresariales prácticas y rentabilidad para desafiar a los actores establecidos.

(Bloomberg) -- Tencent Holdings Ltd. ha lanzado su último modelo de IA fundamental, la vista previa de Hunyuan Hy3, un modelo de 295 mil millones de parámetros dirigido a aplicaciones empresariales, lo que indica una estrategia centrada en soluciones de IA prácticas y rentables en el competitivo mercado de China. El movimiento se produce mientras Tencent y su rival Alibaba Group Holding Ltd. estarían en conversaciones para invertir en la startup de IA DeepSeek, destacando la intensificación de la carrera por el dominio de la IA.
"La vista previa de Hy3 es el primer paso en la reconstrucción del modelo grande de Hunyuan", dijo Yao Shunyue, un ex investigador de OpenAI que ahora lidera el proyecto en Tencent. "Esperamos obtener comentarios reales de la comunidad de código abierto y de los usuarios".
El nuevo modelo tiene 295 mil millones de parámetros totales, pero solo 21 mil millones están activos, una elección de diseño que apunta a un enfoque en la eficiencia y los escenarios comerciales del mundo real. Las fortalezas principales del modelo están en las capacidades de Agente y Codificación, áreas en las que Yao tiene una profunda experiencia. En la plataforma en la nube de Tencent, la vista previa de Hy3 tiene un precio de tan solo 1,2 yuanes (0,17 dólares) por millón de tokens de entrada, una medida diseñada para atraer a una amplia gama de desarrolladores y clientes corporativos.
El lanzamiento de Hy3 es un paso significativo para Tencent a medida que reconstruye su estrategia de IA. La compañía está enfatizando un enfoque de "codiseño", trabajando estrechamente con sus diversos equipos de productos para refinar el rendimiento del modelo en escenarios del mundo real. Esta estrategia contrasta con el enfoque más orientado a la investigación de algunos competidores y se alinea con la tendencia más amplia de la industria de buscar aplicaciones rentables para la IA. El movimiento de Tencent también refleja la creciente importancia de los modelos de código abierto en el panorama de la IA, con empresas como DeepSeek ganando terreno al ofrecer alternativas de código abierto y bajo costo a los modelos patentados de gigantes como OpenAI y Anthropic.
El panorama competitivo en la IA china se está calentando, con Tencent y Alibaba no solo desarrollando sus propios modelos, sino también invirtiendo fuertemente en startups como MiniMax y ahora potencialmente DeepSeek. Este ritmo frenético de desarrollo e inversión está ocurriendo a pesar del acceso limitado de China a la tecnología de semiconductores más avanzada, un desafío que hace que el rendimiento de modelos como Hy3 y DeepSeek sea aún más notable. A medida que amanece la "era de los agentes" de la IA, la capacidad de proporcionar no solo modelos potentes sino también el hardware eficiente para ejecutarlos, como los nuevos chips TPU 8t y 8i de Google, será crucial. El enfoque de Tencent en un modelo más pequeño y eficiente con Hy3 podría ser un movimiento inteligente en un mercado donde el costo y la practicidad son cada vez más importantes.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.