Dans une initiative qui remet en question les coûts élevés du déploiement de l'intelligence artificielle, Knowledge Atlas (02513.HK) a réalisé une augmentation de 132 % de la vitesse de traitement de son modèle GLM-5 pour les tâches de codage, un gain d'efficacité significatif qui pourrait abaisser la barrière financière à l'adoption de l'IA par les entreprises.
La société a détaillé cette percée de performance dans un article de blog technique, précisant que les optimisations étaient axées sur les scénarios de déploiement d'« Agents de Codage » à ultra-large échelle. « Suite à l'optimisation technique sous-jacente, la série GLM-5 a atteint une augmentation allant jusqu'à 132 % du débit du système », a écrit l'équipe d'ingénierie de la société.
Le rapport d'ingénierie précise que les améliorations ont également considérablement augmenté la stabilité du modèle, le taux de sorties anormales du système chutant d'environ 10 pour 10 000 à moins de 3 pour 10 000. Knowledge Atlas a également soumis son correctif à la communauté plus large des développeurs via une pull request vers SGLang, un cadre d'inférence open-source populaire, signalant un engagement à faire progresser la technologie sous-jacente pour tous les utilisateurs.
Cette percée est significative pour les investisseurs car elle s'attaque directement au plus grand obstacle à l'adoption de l'IA : le coût opérationnel immense. En augmentant le débit — le nombre de tâches qu'un modèle peut effectuer dans un temps donné — les entreprises peuvent servir plus d'utilisateurs avec le même matériel, améliorant directement le retour sur investissement des infrastructures d'IA coûteuses, qui reposent souvent sur des GPU de fournisseurs comme Nvidia.
Réduction des coûts, renforcement de la fiabilité
Le double avantage d'un débit plus élevé et de taux d'erreur plus faibles donne à Knowledge Atlas un avantage concurrentiel convaincant. Pour les entreprises qui cherchent à déployer des assistants de codage IA, qui aident les développeurs à écrire et à déboguer du code, la fiabilité est aussi cruciale que la performance. Un agent IA qui produit moins d'erreurs est plus digne de confiance et nécessite moins de supervision humaine, ce qui réduit encore les frictions opérationnelles.
La décision de l'entreprise de contribuer son optimisation au projet open-source SGLang est également stratégique. Elle renforce la réputation de Knowledge Atlas en tant que leader technique et favorise la bienveillance au sein de la communauté du développement de l'IA. Cela peut attirer les meilleurs talents en ingénierie et encourager une adoption plus large de ses modèles par les développeurs qui connaissent déjà le cadre SGLang amélioré. Le correctif spécifique a été soumis dans la Pull Request #22811 à la communauté SGLang.
Pour Knowledge Atlas, une entité cotée à la Bourse de Hong Kong, cette avancée technique pourrait se traduire par une position plus forte sur le marché. À mesure que l'industrie de l'IA mûrit, l'accent se déplace des capacités pures des modèles vers un déploiement efficace, évolutif et rentable. Les performances prouvées de la série GLM-5 dans ce domaine pourraient attirer une nouvelle vague de clients d'entreprise, stimulant la croissance des revenus et offrant un différenciateur clair dans un marché encombré.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.