La nouvelle série de modèles V4 de DeepSeek réduit les coûts d'inférence et prend en charge un contexte d'un million de tokens, une combinaison qui pourrait accélérer le passage des entreprises de simples chatbots à des agents d'IA autonomes et complexes.
L'entreprise chinoise d'IA DeepSeek a lancé sa série de modèles V4, défiant ses rivaux américains avec un système prenant en charge une fenêtre de contexte d'un million de tokens à des coûts qu'elle affirme être considérablement réduits. Ce lancement intensifie la rivalité en matière d'IA entre la Chine et les États-Unis, peu après que la Maison Blanche a accusé des entités chinoises d'efforts pour voler la technologie d'IA américaine.
« Cela répond aux problèmes de longue date de performance ralentie et de coûts élevés associés aux contextes longs, marquant un véritable point d'inflexion pour l'industrie », a déclaré Zhang Yi, fondateur du cabinet de recherche technologique iiMedia, à l'AFP.
La nouvelle série comprend deux versions : le V4-Pro de 1,6 billion de paramètres pour les tâches complexes et le V4-Flash de 284 milliards de paramètres, plus économique. DeepSeek affirme que les capacités de « connaissances mondiales » du V4-Pro ne sont devancées que par le dernier modèle Gemini de Google. Le système est également optimisé pour fonctionner sur les puces du géant technologique chinois Huawei, dont les produits Ascend SuperPoD soutiennent la série V4.
Les gains d'efficacité devraient accélérer la demande en aval pour l'IA agentique, selon un rapport de la CICC. La banque d'investissement s'est dite optimiste pour les développeurs de modèles Zhipu (02513.HK) et MiniMax (00100.HK), estimant qu'ils sont bien positionnés pour bénéficier des avancées technologiques et de l'expansion du marché pour les tâches d'IA complexes à long terme.
L'architecture V4 vise à résoudre le problème du coût des contextes longs
L'innovation centrale de la série V4 est un mécanisme d'attention hybride conçu pour réduire les coûts de calcul et de mémoire généralement associés aux grandes fenêtres de contexte. En optimisant les FLOPs d'inférence par token et l'utilisation du cache KV (KV Cache), DeepSeek vise à rendre les modèles à l'échelle du million de tokens commercialement viables pour les applications grand public.
Cet accent mis sur l'efficacité se reflète dans la tarification de son API. Selon les tarifs publiés, le modèle DeepSeek V4 Pro est proposé à 1,74 $ par million de tokens d'entrée et 3,48 $ pour la sortie. Cela le positionne de manière compétitive par rapport à d'autres modèles haute performance. À titre de comparaison, le MiMo-V2.5-Pro récemment publié par Xiaomi est proposé à 1,00 $ pour l'entrée et 3,00 $ pour la sortie, tandis que le puissant Claude Opus 4.7 d'Anthropic coûte nettement plus cher avec 5,00 $ pour l'entrée et 25,00 $ pour la sortie.
L'IA agentique et l'open source alimentent la compétition
La stratégie de DeepSeek semble axée sur le domaine en pleine croissance de l'IA agentique. La société a déclaré que son modèle V4 est optimisé pour les cadres d'agents d'IA populaires tels qu'OpenClaw et CodeBuddy, qui permettent à l'IA d'accomplir de manière autonome des tâches complexes au nom de l'utilisateur. Ce segment de marché a connu une concurrence intense, des modèles comme le MiMo-V2.5-Pro de Xiaomi démontrant une grande efficacité sur les tests de référence agentiques.
Une partie de la stratégie de DeepSeek consiste à rendre ses systèmes open source, contrairement aux modèles propriétaires d'OpenAI, Google et Anthropic. Cette approche a favorisé l'adoption par les municipalités et les entreprises chinoises, mais a également attiré l'attention. La Maison Blanche a récemment accusé les entreprises chinoises d'utiliser des « campagnes de distillation à l'échelle industrielle pour voler l'IA américaine », une affirmation que Pékin a qualifiée de « sans fondement ». L'approche open source de DeepSeek, combinée à ses revendications de performance et sa compatibilité avec le matériel domestique, marque une étape importante dans l'effort de la Chine pour construire une industrie de l'IA autonome.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.