(Bloomberg) -- OpenAI a dévoilé jeudi GPT-5.5, un nouveau modèle phare qui élargit considérablement sa fenêtre de contexte à 256 000 jetons et intègre des entrées multimodales, intensifiant ainsi la course aux armements en matière d'intelligence artificielle avec son rival Anthropic PBC. Le modèle est conçu pour gérer des tâches complexes en plusieurs parties avec un minimum d'instructions, une fonctionnalité clé pour les clients en entreprise.
« Au lieu de gérer soigneusement chaque étape, vous pouvez confier à GPT-5.5 une tâche complexe et fastidieuse et lui faire confiance pour planifier, utiliser des outils, vérifier son travail, naviguer dans l'ambiguïté et continuer à avancer », a déclaré OpenAI dans son annonce. Le cofondateur Greg Brockman a ajouté que le modèle est « extrêmement » doué pour le codage et le débogage.
Le nouveau modèle s'appuie sur l'architecture de GPT-5.4 mais offre un saut majeur en termes de capacités. Sa fenêtre de contexte de 256 000 jetons permet de traiter des livres entiers ou de longs documents en une seule requête. GPT-5.5 unifie également le traitement du texte, des images, de l'audio et de la vidéo, une rupture par rapport aux modèles précédents qui nécessitaient des systèmes distincts pour différents types de données.
La sortie de GPT-5.5 est un défi direct à Anthropic, qui a récemment publié son propre modèle puissant, Claude Opus 4.7. Les deux sociétés se disputent la domination dans l'espace lucratif de l'IA d'entreprise, en mettant l'accent sur le développement d'agents d'IA sophistiqués capables d'automatiser des flux de travail complexes. Cette initiative intervient également quelques jours seulement avant le début prévu d'un procès trépidant entre Elon Musk et les dirigeants d'OpenAI.
Flux de travail basés sur des agents et architecture unifiée
L'un des axes prioritaires de GPT-5.5 est sa fonctionnalité avancée basée sur des agents. Le modèle peut exécuter des tâches étape par étape, en utilisant des outils tels que des navigateurs Web et des interpréteurs de code pour effectuer des recherches, écrire et déboguer du code, et interagir avec diverses applications. Cela permet à l'IA de fonctionner davantage comme un agent autonome, capable de mener à bien des projets complexes qui nécessitaient auparavant une supervision humaine importante.
Cette capacité accrue est rendue possible par une architecture plus intégrée. Contrairement à ses prédécesseurs, GPT-5.5 traite divers types de données au sein d'un système unique et unifié. Cela améliore non seulement l'efficacité, mais permet également des interactions utilisateur plus naturelles et fluides, en particulier dans les scénarios impliquant des entrées multimédias mixtes. Le modèle sera disponible pour les utilisateurs des niveaux ChatGPT Plus, Pro, Business et Enterprise.
La course aux armements de l'IA s'intensifie
Le lancement de GPT-5.5 souligne la concurrence croissante entre OpenAI et Anthropic, les deux sociétés étant soutenues respectivement par de grands géants de la technologie comme Microsoft et Google. La succession rapide des sorties de modèles — du Claude Opus 4.7 et Mythos Preview d'Anthropic au GPT-5.4-Cyber d'OpenAI et maintenant GPT-5.5 — témoigne d'une bataille féroce pour le leadership du marché de l'IA. Cette compétition se concentre de plus en plus sur les applications d'entreprise, les assistants de codage et la cybersécurité, qui sont considérés comme des moteurs de revenus majeurs.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.