Un point d'inflexion pour l'inférence IA alimente un essor du marché chinois de la location de puissance de calcul, où les prix augmentent et les capacités sont épuisées.
Une explosion de la demande d'inférence en intelligence artificielle a déclenché un cycle de forte croissance pour le marché chinois de la location de calcul, avec une hausse marquée des prix des locations de GPU et des services cloud au premier semestre 2026. Un récent rapport de Guohai Securities souligne un bond de près de 40 % du coût de location des GPU H100 de Nvidia, signe d'un resserrement de l'offre alors que les charges de travail IA passent de l'entraînement à l'inférence.
« Le tournant de l'inférence IA est arrivé, et la location de puissance de calcul est entrée dans un cycle de haute prospérité avec une hausse des volumes et des prix », ont déclaré les analystes de Guohai Securities dans un rapport du 21 avril. Le cabinet a identifié le secteur comme un axe central avec une forte certitude dans la chaîne industrielle actuelle de l'IA.
Les données confirment une tendance claire à des hausses de prix coordonnées. Le prix de location sur un an d'un GPU H100 est passé d'un plus bas de 1,70 $ l'heure en octobre 2025 à 2,35 $ en mars 2026. Au cours de la même période, les principaux fournisseurs de cloud chinois, dont Tencent Cloud, Alibaba Cloud et Baidu Cloud, ont annoncé des augmentations de prix allant de 5 % à plus de 400 % pour divers services de calcul IA.
Cette flambée des prix profite directement aux revenus des fournisseurs de puissance de calcul, mais augmentera les coûts opérationnels pour les développeurs de modèles d'IA qui stimulent la demande. La tendance pourrait accélérer la consolidation du marché, car les petits acteurs peinent à absorber les coûts plus élevés, tandis que les loueurs bien capitalisés sont prêts pour une croissance significative des bénéfices à long terme une fois que leurs investissements matériels initiaux seront totalement amortis.
L'essor de l'inférence et la croissance à l'étranger stimulent la demande
Le principal moteur des hausses de prix est un changement fondamental dans les charges de travail de l'IA. Alors que les deux dernières années ont été dominées par le processus intensif en calcul de l'entraînement des grands modèles, l'industrie entre maintenant dans une nouvelle phase axée sur l'inférence — le processus consistant à utiliser des modèles entraînés pour générer du texte, des images ou des prédictions. Selon le PDG de Nvidia, Jensen Huang, cette phase d'inférence est beaucoup plus vaste, la demande de calcul ayant été multipliée par 10 000 au cours des deux dernières années.
Les données des entreprises chinoises montrent une croissance explosive. Le grand modèle Doubao de ByteDance a vu son volume quotidien de tokens doubler en trois mois pour dépasser les 120 000 milliards en mars 2026, soit une augmentation de 1 000 fois depuis son lancement. Cette explosion de la demande de tokens, portée par des applications à haute fréquence comme les agents IA et la génération multimodale, crée une boucle de rétroaction positive pour les modèles nationaux.
Les entreprises chinoises d'IA rencontrent également un succès significatif à l'étranger. Les données d'OpenRouter montrent que pendant six semaines consécutives au début de 2026, les modèles d'IA affichant le volume d'appels mondial le plus élevé étaient tous chinois. Pour Kimi, les revenus à l'étranger avaient déjà dépassé les revenus nationaux en février 2026, tandis qu'environ 73 % des revenus de MiniMax proviennent des marchés internationaux.
Les loueurs lèvent des dizaines de milliards pour étendre leurs capacités
En réponse à la demande florissante, les fournisseurs chinois de puissance de calcul lèvent agressivement des capitaux pour étendre leurs infrastructures. Ces entreprises opèrent sur un modèle d'investissements initiaux lourds dans des centres de données et des serveurs, suivis de revenus locatifs stables à long terme. Les contrats durent généralement de 2 à 5 ans, offrant un flux de trésorerie prévisible.
Plusieurs entreprises ont annoncé des plans de financement et d'expansion majeurs en 2026.
- Xccelerated Data (协创数据), qui a sollicité un total de 50 milliards de yuans de lignes de crédit, vise également une cotation à la Bourse de Hong Kong.
- HongJing Technology (宏景科技) recherche 60 milliards de yuans de crédit et prévoit de lever 1,29 milliard de yuans supplémentaires, la majorité étant affectée à la construction de ses clusters de calcul intelligent.
- D'autres acteurs comme Shengshi Technology (盛视科技) et Zhiwei Intelligence (智微智能) ont également obtenu des lignes de crédit de 23 milliards de yuans et 14 milliards de yuans respectivement.
Selon le rapport Guohai, les entreprises disposant de canaux d'approvisionnement stables et d'un financement important peuvent déployer rapidement de nouvelles capacités de calcul, verrouillant des contrats à long terme qui offrent une forte visibilité pour la croissance future des revenus et des bénéfices.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.