T-Head, filiale d'Alibaba, a déployé plus de 100 000 de ses puces IA Zhenwu conçues en interne auprès de plus de 150 institutions financières, marquant l'un des plus importants déploiements de puces domestiques dans le secteur bancaire chinois.
« Cette ampleur de déploiement montre que les puces IA passent du stade pilote à la production dans les services financiers », a déclaré Zhang Chi, vice-président de l'unité commerciale de cloud public au sein d'Alibaba Cloud Intelligence Group, lors de la 32e édition du China International Financial Exhibition.
Les livraisons cumulées de la série Zhenwu ont atteint 560 000 unités, a révélé T-Head pour la première fois lors du sommet Alibaba Cloud 2026 le mois dernier. Les puces sont déployées dans la gestion de patrimoine, le contrôle du risque de crédit, la recherche en investissement et la surveillance de la conformité dans plus de 150 banques, courtiers, assureurs et sociétés de gestion d'actifs.
Cette montée en puissance renforce la position d'Alibaba sur le marché chinois des puces IA, où les alternatives domestiques aux H100 et B200 de Nvidia sont très demandées à la suite des restrictions américaines à l'exportation sur les semi-conducteurs avancés. T-Head prévoit de lancer les puces plus puissantes Zhenwu V900 et J900 au cours des deux prochaines années, une feuille de route qui pourrait étendre sa portée au-delà de la finance vers des charges de travail cloud et d'IA d'entreprise plus larges.
Ce déploiement confère à Alibaba Cloud un avantage concurrentiel face à la série de puces Ascend de Huawei, l'autre grand concurrent chinois dans le domaine des puces IA. Alors que le H100 de Nvidia offre 990 TFLOPS de performance FP16 selon les spécifications publiées, Alibaba n'a pas divulgué de données comparables pour la série Zhenwu face aux produits de Nvidia ou de Huawei.
La stratégie de puces internes d'Alibaba reflète celle d'autres hyperscalers. Le Trainium d'Amazon et le TPU de Google ont également réduit la dépendance vis-à-vis des fournisseurs externes de GPU pour les charges de travail internes. Pour Alibaba, les puces Zhenwu prennent également en charge sa famille de grands modèles de langage Qwen, créant une pile IA verticalement intégrée, du silicium à l'application.
Le secteur financier représente une tête de pont lucrative. Le secteur bancaire chinois a dépensé environ 300 milliards de yuans (41,4 milliards de dollars) en technologies en 2025, selon IDC, dont une part croissante consacrée à l'infrastructure IA. Les relations existantes de T-Head avec plus de 150 institutions financières lui offrent un canal de distribution que des concurrents comme Cambricon Technologies et Biren Technology n'ont pas encore égalé.
Alibaba Cloud ne divulgue pas le prix des puces Zhenwu, qui sont proposées dans le cadre de ses services cloud plutôt que comme produits autonomes. La société a indiqué que les livraisons cumulées de 560 000 unités couvrent à la fois les charges de travail internes d'Alibaba et les déploiements clients externes.
Pour les investisseurs, cette montée en puissance des puces pourrait améliorer la marge d'Alibaba Cloud au fil du temps. L'unité cloud a déclaré un chiffre d'affaires de 31,7 milliards de yuans (4,4 milliards de dollars) au trimestre de décembre, en hausse de 13 % sur un an, les revenus liés à l'IA progressant à un rythme à trois chiffres. Le remplacement des GPU Nvidia par du silicium interne pour les charges de travail d'inférence pourrait réduire le coût par requête de 40 % à 60 %, selon les estimations des analystes de Bernstein. Les actions d'Alibaba cotées aux États-Unis se négocient à environ 12 fois les bénéfices à terme, soit une décote par rapport aux 35 fois d'Amazon, reflétant en partie l'incertitude du marché quant au rythme de la monétisation de l'IA par Alibaba.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.