L'IA open-source réduit l'écart à 3 mois alors que 4 modèles redessinent 2026

Les modèles d'IA open-source ont réduit l'écart de capacités avec les systèmes frontière closed-source à seulement trois mois, selon une analyse de juin 2026 menée par OpenRouter, quatre modèles rivalisant désormais avec les offres d'OpenAI et Anthropic à une fraction du coût.

« L'écart entre les modèles ouverts et fermés s'est stabilisé entre 3 et 6 mois depuis 18 mois, et rien n'indique que les laboratoires closed-source creusent à nouveau la distance », écrit OpenRouter dans son rapport, qui identifie les quatre lancements open-weight les plus marquants de 2026.

DeepSeek V4 Flash domine en matière d'efficacité-coût. Ce modèle à mélange d'experts de 284 milliards de paramètres, publié en avril sous licence MIT, atteint 79 % sur SWE-bench Verified — à moins de 1,6 point de sa variante Pro — tout en facturant la sortie à 28 cents par million de tokens, soit environ 1/150e du coût de GPT-5.5 d'OpenAI. GLM 5.2, publié à la mi-juin par le chinois Z.ai, trône en tête du classement open-source sur l'Intelligence Index d'Artificial Analysis avec un score de 51, à seulement 5 points du désormais interdit Fable 5 d'Anthropic. Ce modèle de 744 milliards de paramètres, entièrement entraîné sur 100 000 puces Huawei Ascend 910B sans aucun matériel Nvidia, a obtenu 62,1 sur SWE-bench Pro, devant le 58,6 de GPT-5.5.

Cette convergence a des implications directes pour l'investissement. Les entreprises qui migrent leurs flux de codage et agentiques des API fermées vers des modèles open-weight peuvent réduire leurs coûts d'inférence de 50 à 150 fois, selon les comparaisons tarifaires d'OpenRouter. Cette dynamique menace le pouvoir de fixation des prix d'OpenAI et d'Anthropic tout en profitant aux fournisseurs d'infrastructures qui prennent en charge les déploiements auto-hébergés — et soulève des questions sur la valeur stratégique des contrôles à l'exportation américains, GLM 5.2 étant arrivé la même semaine où Washington a ordonné à Anthropic de restreindre l'accès à Fable 5 pour les ressortissants étrangers.

DeepSeek V4 Flash est devenu le premier modèle open-weight que les développeurs intègrent systématiquement directement dans des flux agentiques en remplacement direct des systèmes Anthropic ou OpenAI, selon OpenRouter. Sa variante Flash conserve la majeure partie des capacités de codage de la version Pro — 79 % contre 80,6 % sur SWE-bench Verified — tout en sous-cotant GPT-5.5 sur le coût de sortie d'un facteur 150. DeepSeek a rendu permanente sa tarification réduite en mai, cimentant une guerre des prix au niveau de l'intelligence frontière. Le compromis : le modèle nécessite des invites inhabituellement spécifiques et obtient de piètres résultats en écriture créative et en contrôle de tonalité, limitant son utilisation dans les tâches de génération de contenu.

L'arrivée de GLM 5.2 a eu un poids géopolitique. Le département du Commerce américain a ordonné le 12 juin à Anthropic de désactiver Fable 5 et Mythos 5 pour tous les ressortissants étrangers, invoquant une vulnérabilité de jailbreak qu'Anthropic a contestée. Z.ai a publié GLM 5.2 sous licence MIT cinq jours plus tard, offrant aux développeurs du monde entier un modèle téléchargeable et auto-hébergeable — à l'abri de toute future ordonnance d'exportation. Sur Code Arena, le classement de type Elo fondé sur des votes humains en aveugle, GLM 5.2 s'est classé deuxième au général avec 1 595 points, premier parmi tous les modèles actuellement disponibles depuis le retrait de Fable 5. Sur Design Arena, il a pris la première place sans partage. Les écarts qui subsistent concernent les benchmarks de raisonnement les plus difficiles : sur ARC-AGI-2, qui teste le raisonnement fluide résistant à la contamination des données, le meilleur modèle chinois obtient 11,8 %, bien en deçà des grands laboratoires américains.

MiniMax M3 occupe un créneau différent. C'est le seul des quatre modèles à comprendre nativement le texte, les images, les graphiques et la vidéo, ce qui en fait le choix par défaut pour les flux agentiques nécessitant la lecture d'écran, l'automatisation d'interface utilisateur ou l'analyse de documents visuels. Il obtient 44 sur l'Intelligence Index, à égalité avec DeepSeek V4 Pro, et correspond approximativement à Claude Sonnet 4.6 sur les tâches agentiques réelles. Sa tarification — 9,8 cents par million de tokens d'entrée et 1,21 $ pour la sortie — sous-cote Gemini Flash de Google sur les charges de travail multimodales, bien que sa licence communautaire exige une attribution pour usage commercial et une autorisation écrite pour les produits à grande échelle.

Le Nemotron 3 Ultra de NVIDIA représente le contre-poids américain en entreprise. Ce hybride Mamba-2 et Transformer de 550 milliards de paramètres, avec un score de 48 sur l'Intelligence Index, est devancé par GLM 5.2 sur les benchmarks bruts mais offre une efficacité de déploiement supérieure sur la propre pile matérielle de Nvidia. Nvidia a ouvert en open-source non seulement les poids du modèle mais aussi les données d'entraînement, la recette, les outils d'évaluation et l'infrastructure d'apprentissage par renforcement sous licence OpenMDW — une stratégie conçue pour stimuler la demande pour ses puces et son écosystème logiciel. La précision NVFP4 du modèle et son support de prédiction multi-tokens en font le choix le plus pratique pour les entreprises qui privilégient la rapidité de déploiement, le contrôle des données et la stabilité du fournisseur plutôt que les scores de benchmark maximaux.

Pour les investisseurs, la convergence open-source crée un pari à double face. Des entreprises comme Nvidia bénéficient indirectement de l'adoption open-weight qui stimule la demande de matériel d'inférence — Nemotron est autant un véhicule de vente pour la pile IA de Nvidia qu'un produit autonome. Mais l'effondrement des prix menace les modèles de revenus des fournisseurs d'API fermées : OpenAI et Anthropic subissent une pression pour justifier des prix premium alors que les alternatives ouvertes offrent des performances de codage comparables à 1/150e du coût. Microsoft, qui héberge les modèles d'OpenAI sur Azure, pourrait capter une demande compensatrice si les entreprises migrant vers des modèles open-weight choisissent Azure pour l'infrastructure gérée. Le risque clé : les modèles open-source échouent aux tests de sécurité et de conformité en production, ralentissant l'adoption et préservant le pouvoir de fixation des prix des systèmes closed-source.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.