KNOWLEDGE ATLAS (02513.HK) a dopé sa puissance de calcul IA, augmentant le débit d'inférence GPU moyen de 15 % après avoir déployé la nouvelle architecture réseau ZCube dans son environnement de production réel. Cette initiative renforce sa position concurrentielle en tant que partenaire d'infrastructure clé pour les géants du cloud comme Alibaba Cloud.
« En réponse aux défis de plus en plus graves de congestion structurelle du réseau... ZCube a réalisé des percées uniquement grâce à l'optimisation architecturale », a déclaré la société dans un communiqué. La recherche a été menée conjointement avec Yuxun Network et l'Université Tsinghua. Lors de tests de référence au sein de l'environnement de production de codage GLM-5.1, l'entreprise a réduit les dépenses d'investissement en commutateurs et modules optiques de 33 %.
Au-delà des économies de coûts et des gains de débit, l'architecture a également amélioré la latence, le Time to First Token (TTFT) P99 chutant de 40,6 %. Ces améliorations ont été obtenues sans modification des GPU existants, de la pile logicielle ou des applications, soulignant l'efficacité de l'optimisation au niveau du réseau. La société n'a pas divulgué la capacité totale en MW de l'environnement mis à niveau.
Cette mise à niveau architecturale renforce la position de KNOWLEDGE ATLAS sur le marché très disputé des infrastructures d'IA. En tant que partenaire d'acteurs majeurs comme Alibaba Cloud sur sa plateforme Bailian, selon un récent rapport de CMSI, il est crucial de démontrer un rapport performance-prix supérieur. La réduction de 33 % du capex sur le matériel réseau se traduit directement par des marges plus élevées et une structure de prix plus compétitive, permettant potentiellement à KNOWLEDGE ATLAS de remporter des contrats plus importants auprès des entreprises et des géants du cloud aux prises avec l'explosion des coûts de développement des capacités d'IA.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.