Le nouveau modèle Hunyuan Hy3 de Tencent, doté de 295 milliards de paramètres, entre sur le marché concurrentiel de l'IA en se concentrant sur les applications d'entreprise pratiques et l'efficacité des coûts pour défier les acteurs établis.
Retour
Le nouveau modèle Hunyuan Hy3 de Tencent, doté de 295 milliards de paramètres, entre sur le marché concurrentiel de l'IA en se concentrant sur les applications d'entreprise pratiques et l'efficacité des coûts pour défier les acteurs établis.

(Bloomberg) -- Tencent Holdings Ltd. a publié son dernier modèle d'IA fondamental, l'aperçu Hunyuan Hy3, un modèle de 295 milliards de paramètres destiné aux applications d'entreprise, signalant une stratégie axée sur des solutions d'IA pratiques et rentables sur le marché concurrentiel chinois. Cette initiative intervient alors que Tencent et son rival Alibaba Group Holding Ltd. seraient en pourparlers pour investir dans la startup d'IA DeepSeek, soulignant l'intensification de la course à la domination de l'IA.
« L'aperçu Hy3 est la première étape de la reconstruction du grand modèle Hunyuan », a déclaré Yao Shunyue, un ancien chercheur d'OpenAI qui dirige désormais le projet chez Tencent. « Nous espérons obtenir des retours réels de la part de la communauté open source et des utilisateurs. »
Le nouveau modèle dispose de 295 milliards de paramètres au total, mais seuls 21 milliards sont actifs, un choix de conception qui souligne une attention particulière portée à l'efficacité et aux scénarios commerciaux réels. Les points forts du modèle résident dans les capacités d'Agent et de Codage, des domaines où Yao possède une expertise approfondie. Sur la plateforme cloud de Tencent, l'aperçu Hy3 est proposé à un prix commençant à 1,2 yuan (environ 0,17 $) par million de tokens en entrée, une mesure conçue pour attirer un large éventail de développeurs et de clients d'entreprise.
Le lancement de Hy3 est une étape significative pour Tencent alors qu'il reconstruit sa stratégie d'IA. L'entreprise met l'accent sur une approche de « co-conception », travaillant en étroite collaboration avec ses différentes équipes de produits pour affiner les performances du modèle dans des scénarios réels. Cette stratégie contraste avec l'approche plus orientée vers la recherche de certains concurrents et s'aligne sur la tendance plus large de l'industrie à rechercher des applications rentables pour l'IA. L'initiative de Tencent reflète également l'importance croissante des modèles open source dans le paysage de l'IA, avec des entreprises comme DeepSeek gagnant du terrain en proposant des alternatives open source à bas prix aux modèles propriétaires de géants comme OpenAI et Anthropic.
Le paysage concurrentiel de l'IA en Chine s'intensifie, Tencent et Alibaba ne se contentant pas de développer leurs propres modèles, mais investissant également massivement dans des startups comme MiniMax et désormais potentiellement DeepSeek. Ce rythme frénétique de développement et d'investissement se poursuit malgré l'accès limité de la Chine à la technologie des semi-conducteurs la plus avancée, un défi qui rend les performances des modèles comme Hy3 et DeepSeek encore plus notables. Alors que l'ère des « agents » de l'IA commence, la capacité à fournir non seulement des modèles puissants mais aussi le matériel efficace pour les faire fonctionner, comme les nouvelles puces TPU 8t et 8i de Google, sera cruciale. L'accent mis par Tencent sur un modèle plus petit et plus efficace avec Hy3 pourrait être une décision judicieuse dans un marché où le coût et l'aspect pratique deviennent de plus en plus importants.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.