Qijing Tech lève plusieurs centaines de millions pour réduire les coûts de l'IA de 80 %

Une importante levée de fonds pour une start-up d'infrastructure d'IA signale un pivot du marché, passant des dépenses massives d'entraînement de modèles à l'économie de leur fonctionnement. Le 20 mai, le fournisseur d'infrastructure d'IA Qijing Technology a annoncé avoir clôturé un tour de table de série Pre-A de plusieurs centaines de millions de yuans, co-dirigé par StarLink Capital et Huakong Technology, avec la participation de l'actionnaire existant Hillhouse Capital.

Ce financement important dans un marché du capital-risque prudent montre que l'intérêt des investisseurs délaisse la course aux modèles toujours plus grands pour se concentrer sur les défis pratiques du déploiement commercial. Le marché récompense désormais les entreprises capables de résoudre les coûts élevés et souvent inefficaces associés à l'utilisation de modèles d'IA à grande échelle, un processus connu sous le nom d'inférence.

La thèse centrale de Qijing est que l'accent mis par l'industrie sur le « Model-as-a-Service » (MaaS) est mal placé. Au lieu de cela, elle propose du « Token-as-a-Service » (TaaS), liant directement l'unité de sortie de l'IA au coût. L'entreprise cible une inefficacité critique dans le déploiement de l'IA : l'utilisation du matériel. Les méthodes d'inférence traditionnelles reposent massivement sur la mémoire GPU coûteuse, laissant une grande partie du CPU et de la RAM standard du système inactifs, avec une utilisation globale du matériel souvent inférieure à 20 %. L'architecture « Liuhe » et la technologie « Yuebing » de Qijing visent à résoudre ce problème en repensant la gestion du KV Cache, un composant clé du traitement de l'IA, réduisant ainsi la dépendance aux GPU coûteux. L'entreprise fournit déjà des services d'inférence pour des modèles majeurs comme le GLM de Zhipu, traitant près d'un billion de tokens par jour.

Cet accent mis sur l'efficacité arrive alors que l'industrie de l'IA est confrontée aux coûts cachés de la mise à l'échelle. Bien que les grands modèles de langage (LLM) entraînés sur des milliers de milliards de paramètres soient puissants, ils sont coûteux à faire fonctionner et peuvent être inefficaces pour de nombreuses tâches. Certaines entreprises constatent que des modèles plus petits et plus compacts peuvent offrir un meilleur équilibre entre performance et coût, répondant cinq à dix fois plus vite que les modèles plus grands pour certaines applications. Cela a créé une opportunité commerciale claire pour les fournisseurs d'infrastructure capables d'optimiser le coût total de possession, en allant au-delà des coûts initiaux du modèle pour inclure les dépenses courantes telles que la maintenance, la surveillance et la consommation d'énergie.

Le nouveau champ de bataille concurrentiel

Le besoin d'optimisation de l'inférence est intensifié par un déséquilibre entre l'offre et la demande de puissance de calcul. En mars 2026, des fournisseurs majeurs comme Tencent Cloud, Alibaba Cloud et Baidu Smart Cloud ont augmenté les prix des services de calcul d'IA, certains coûts de modèles augmentant de plus de 460 %. Cet environnement crée une ouverture significative pour des entreprises spécialisées comme Qijing.

Cependant, l'entreprise fait face à un terrain encombré. L'espace de l'infrastructure d'IA comprend non seulement d'autres start-up soutenues par du capital-risque comme Silicon Flow et MoreThanAI, mais aussi les redoutables acteurs historiques du cloud. Des géants de la technologie comme Alibaba Cloud, Huawei Cloud et Volcano Engine de ByteDance renforcent tous leurs propres capacités d'infrastructure d'IA « full-stack ». Pour réussir, Qijing doit utiliser son financement pour construire un fossé technologique suffisamment profond et s'assurer la fidélité de ses clients avant que les géants ne puissent combler l'écart ou proposer des services groupés « assez bons » pour le marché de masse. Le succès de l'entreprise dépendra de sa capacité à transformer un avantage technique en une croissance commerciale durable dans une industrie en évolution rapide.

Cet article est destiné à des fins d'information uniquement et ne constitue pas un conseil en investissement.