GPT-5.3-Codex atteint un score de 77.3%, dépassant le modèle rival
OpenAI a déclenché un conflit direct avec son concurrent Anthropic en lançant son nouveau modèle de programmation, GPT-5.3-Codex, jeudi au moment précis où Anthropic a publié sa mise à jour phare, Claude Opus 4.6. Ce lancement synchronisé marque une escalade significative dans la bataille pour le marché des logiciels d'IA d'entreprise. OpenAI affirme que son nouveau modèle constitue un bond en avant majeur, obtenant un score de 77.3% au benchmark Terminal-Bench 2.0, un test mesurant les compétences essentielles d'opération de terminal pour les agents de programmation. Cela représente une amélioration de 13 points de pourcentage par rapport à son prédécesseur et dépasse considérablement le score de 65.4% rapporté par l'Opus 4.6 d'Anthropic.
Au-delà des benchmarks, OpenAI a souligné des gains d'efficacité significatifs, déclarant que le nouveau modèle nécessite moins de la moitié des tokens de son prédécesseur tout en augmentant la vitesse d'inférence de plus de 25%. Dans une étape importante pour l'industrie, la société a également révélé que les premières versions de GPT-5.3-Codex ont été utilisées dans son propre développement, débogage et déploiement. Le PDG d'OpenAI, Sam Altman, a noté : "Nous voir utiliser 5.3-Codex pour construire 5.3-Codex... était un aperçu puissant de l'avenir."
Les dépenses d'IA d'entreprise devraient atteindre 11.6 millions de dollars par firme alors que l'avance d'OpenAI se réduit
La course aux armements technologiques est alimentée par une explosion des dépenses d'IA des entreprises. Selon une enquête d'Andreessen Horowitz, les dépenses moyennes des entreprises pour les grands modèles de langage devraient atteindre 7 millions de dollars en 2025, soit une augmentation de 180% par rapport aux 2.5 millions de dollars dépensés en 2024. Ce chiffre devrait encore augmenter de 65% pour atteindre 11.6 millions de dollars d'ici 2026. Cette manne en expansion rapide intensifie la concurrence pour la part de marché.
Les mêmes données révèlent un paysage changeant. Bien qu'OpenAI reste l'acteur dominant, sa part des dépenses d'IA d'entreprise devrait passer de 62% en 2024 à 53% d'ici 2026. Au cours de la même période, la part de marché d'Anthropic devrait passer de 14% à 18%, Google capturant également une part croissante du marché. Cette pression concurrentielle contribue à expliquer la rivalité de plus en plus publique, qui a récemment vu Altman et Anthropic s'affronter sur les stratégies publicitaires.
OpenAI étend Codex du codeur à l'agent généraliste
OpenAI repositionne stratégiquement Codex d'un assistant de programmation spécialisé à un agent polyvalent capable de gérer un large éventail de tâches de connaissance. La société a déclaré que le modèle peut désormais gérer des tâches allant du débogage et du déploiement à la recherche utilisateur et à l'analyse de données dans des feuilles de calcul, signalant un défi direct au marché plus large des logiciels de productivité d'entreprise dominé par des acteurs comme Microsoft et Salesforce.
Pour renforcer sa position, OpenAI a également désigné GPT-5.3-Codex comme son premier modèle à "haute capacité" en cybersécurité, entraîné spécifiquement pour identifier les vulnérabilités logicielles. Pour accélérer l'adoption et les capacités de défense, Altman a annoncé un engagement de 10 millions de dollars en crédits API pour les chercheurs en cybersécurité.
C'est l'ère des bâtisseurs, pas de ceux qui veulent les contrôler.
— Sam Altman, PDG, OpenAI