Le challenger chinois de l'IA DeepSeek a considérablement augmenté la fenêtre de contexte de son API principale à 1 million de tokens, une escalade majeure dans sa tentative de rivaliser avec les modèles de pointe d'OpenAI, Google et Anthropic. Cette mise à jour non annoncée, qui repousse également la date limite des connaissances du modèle à mai 2025, aligne son offre pour les développeurs sur son application grand public et signale un nouveau front dans la bataille pour l'adoption de l'IA en entreprise.
« Je jouais avec l'API et j'ai remarqué qu'elle n'est plus différente de l'application officielle maintenant », a écrit un développeur sur une plateforme de médias sociaux, reflétant une vague de commentaires de la communauté qui a repéré le changement en premier. « La capacité de traiter l'intégralité de la trilogie du "Problème à trois corps" en une seule fois est désormais disponible via l'API. »
La mise à jour remplace la précédente fenêtre de contexte de 128 000 tokens et une date de connaissance de 2024. Ce mouvement est largement perçu comme un précurseur du lancement formel du modèle V4 de DeepSeek, que le fondateur Liang Wenfeng a indiqué en interne être prévu pour la fin avril 2026. L'entreprise n'a pas encore commenté officiellement les changements de l'API.
Cette poussée agressive commoditise une fonctionnalité clé qui, jusqu'à récemment, était un différenciateur majeur pour les modèles de premier plan. En offrant une fenêtre de contexte massive directement via son API, DeepSeek exerce une pression directe sur les prix et les capacités de concurrents tels que Gemini 3.1 Pro de Google et la série Claude d'Anthropic, les forçant à défendre leur proposition de valeur pour les flux de travail d'entreprise à haut débit.
Le champ de bataille du million de tokens s'intensifie
La course pour offrir des fenêtres de contexte plus larges est une dimension critique de la guerre des plateformes d'IA. Un contexte plus large permet aux modèles de traiter et de raisonner sur de vastes quantités d'informations — telles que des bases de code entières, des rapports financiers ou des œuvres littéraires — en une seule passe. Cette capacité est cruciale pour les applications d'entreprise complexes dans la finance, le droit et la recherche scientifique.
Google a récemment fait sensation avec ses propres agents de recherche autonomes, Deep Research et Deep Research Max, basés sur le modèle Gemini 3.1 Pro. Alors que les agents de Google se concentrent sur la fusion des données web avec des informations d'entreprise propriétaires, le mouvement de DeepSeek se concentre sur la fourniture d'une capacité de contexte brute à grande échelle en tant qu'utilitaire pour les développeurs. La mise à jour place DeepSeek dans une conversation directe avec Anthropic, qui a également fait des larges fenêtres de contexte une partie centrale de son offre. La question clé pour les développeurs sera le compromis entre qualité, latence et coût, car les performances sur un contexte long peuvent se dégrader. Certains développeurs ont noté que les performances de l'API mise à jour semblaient similaires au modèle « rapide » de DeepSeek, suggérant un compromis potentiel pour la fenêtre élargie.
De la divergence de l'API au tremplin V4
La mise à jour résout une divergence de longue date où l'application publiquement disponible de DeepSeek offrait des fonctionnalités plus avancées que son API, une source de frustration pour les développeurs construisant sur la plateforme. Le déploiement discret a mené à des spéculations selon lesquelles l'entreprise reliait temporairement son API aux serveurs de l'application tout en mettant à niveau les modèles sous-jacents pour le lancement officiel de la V4.
Ce mouvement intervient alors que DeepSeek, qui a historiquement évité les financements extérieurs, serait sur le marché pour lever des fonds à une valorisation proche de 10 milliards de dollars, selon des rapports de The Information. Cette injection de capital fournirait les ressources nécessaires pour rivaliser dans la course aux armements de l'IA incroyablement coûteuse, où l'entraînement d'un seul modèle de pointe peut coûter des milliards de dollars en temps de calcul GPU.
Pour les investisseurs, l'émergence de DeepSeek en tant que concurrent bien financé et techniquement agressif ajoute une nouvelle variable au paysage. Bien qu'il s'agisse d'une entité privée, ses actions peuvent avoir un impact sur les acteurs de l'IA cotés en bourse en forçant des baisses de prix, en accélérant le rythme de l'innovation et en capturant potentiellement des parts de marché auprès des développeurs et des clients d'entreprise à la recherche de modèles rentables et de haute capacité. Le lancement prochain de DeepSeek V4 sera un test critique pour savoir si ses performances peuvent réellement défier la domination des modèles de Google et OpenAI.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.