Le nouveau modèle d'IA phare de Tencent Holdings, Hy3, affiche des performances de premier ordre sur les bancs d'essai publics, signalant la compétitivité croissante de l'entreprise dans la course mondiale à l'échelle. Le modèle s'est régulièrement classé en tête du classement de consommation de tokens d'OpenRouter depuis fin avril, un indicateur clé de l'intérêt et de l'utilisation des développeurs, et a récemment été mis en avant comme premier sur la plateforme.
Cet élan intervient alors que GMI Cloud a annoncé la disponibilité de l'aperçu de Hy3 sur sa plateforme d'infrastructure, révélant des spécifications clés qui le positionnent face aux autres modèles à grande échelle. Selon GMI Cloud, Hy3, disponible en open-source, est un modèle de type Mixture-of-Experts (MoE) doté de 295 milliards de paramètres et d'une fenêtre de contexte de 256 000 tokens, conçu pour exceller dans le raisonnement complexe, le codage et les tâches à contexte long.
Les mesures de performance placent l'offre de Tencent dans le peloton de tête des modèles classés publiquement, aux côtés de concurrents comme le V4 de DeepSeek. Cette avancée souligne la conviction dominante dans l'industrie selon laquelle les modèles de fondation plus grands et plus puissants définiront la prochaine phase de l'innovation en IA, une course où l'intensité de calcul et les scores de référence sont les principaux indicateurs de succès.
Mais pour les entreprises clientes, particulièrement dans le paysage réglementaire fragmenté de l'Asie-Pacifique, la montée en puissance des modèles hyperscale présente un ensemble de défis différents. « En Asie, quand je regarde le boom de l'IA, la souveraineté est plus mesurée que les modèles eux-mêmes », a déclaré Hans Dekkers, directeur général d'IBM Asie-Pacifique, lors d'une interview récente, pointant du doigt un décalage croissant entre les capacités des modèles et le déploiement réel en entreprise.
La course à l'échelle face à la réalité des entreprises
Alors que le marché célèbre l'intelligence généraliste, les entreprises opèrent dans le cadre d'exigences réglementaires strictes et autour de jeux de données propriétaires qui ne peuvent être exposés à des modèles externes. Ce décalage structurel est un obstacle majeur à l'adoption, Dekkers notant que « 99 % des données d'entreprise ne sont toujours pas touchées par l'IA », non pas à cause de limites techniques, mais en raison de préoccupations profondes concernant la souveraineté des données et la conformité.
Pour de nombreuses entreprises, la perspective d'envoyer des données internes à un grand fournisseur d'IA centralisé est inenvisageable. Cette réticence est amplifiée par les diverses lois sur la localisation des données à travers l'Asie, rendant une stratégie mono-modèle de plus en plus intenable pour les multinationales. Le problème central n'est pas la puissance brute d'un modèle, mais sa capacité à opérer dans les limites rigides que les entreprises ne peuvent se permettre de franchir.
Cela a conduit à une approche architecturale différente qui gagne du terrain au sein des entreprises. Au lieu de s'appuyer sur une IA massive et polyvalente, les entreprises s'orientent vers le déploiement de dizaines, voire de centaines de systèmes plus petits, spécifiques à un domaine et entraînés sur leurs propres données privées. « Je crois que chaque client aura 100 à 200 de ces modèles à l'avenir », a déclaré Dekkers, envisageant des systèmes spécialisés pour des fonctions telles que le prêt, le trading et les RH.
Des modèles plus grands vers une orchestration plus intelligente
À mesure que les entreprises adoptent une stratégie multi-modèles, le défi central passe de la construction du plus grand modèle à la gestion efficace d'un réseau distribué de ceux-ci. La question critique devient celle de l'orchestration : comment s'assurer que le bon modèle est utilisé pour la bonne tâche, maintenir la conformité au-delà des frontières et intégrer diverses sorties d'IA dans des flux de travail cohérents.
C'est là que se déplace le centre de la compétition. IBM, pour sa part, se positionne comme une plateforme d'orchestration de classe entreprise, offrant un environnement « apportez votre propre modèle ». Ce système permet aux clients de déployer divers modèles — provenant de fournisseurs mondiaux comme Google, d'acteurs régionaux comme Tencent ou Alibaba, ou de leurs propres équipes internes — au sein d'un cadre unique et gouverné. « Nous permettons aux clients d'utiliser le meilleur outil pour chaque tâche », a déclaré Dekkers, soulignant le contrôle et la sécurité.
Pour le Hy3 de Tencent, son succès dans les classements est une victoire claire dans la course aux capacités techniques. Cependant, sa valeur à long terme sur le marché des entreprises dépendra peut-être moins de ses performances autonomes que de la manière dont il pourra être intégré efficacement dans ces systèmes d'orchestration multi-modèles et multi-fournisseurs émergents. Les gagnants ultimes ne seront peut-être pas ceux qui construisent le plus gros moteur, mais ceux qui construisent le système le plus efficace pour tous les piloter.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.