Des informations ayant fui suggèrent qu'OpenAI mobilise toutes ses ressources sur un nouveau modèle, nommé de code 'Spud', dans une tentative risquée d'atteindre l'intelligence artificielle générale.
OpenAI s'apprêterait à lancer GPT-6 dès le 14 avril, une initiative qui intensifierait la course aux armements de l'intelligence artificielle avec un bond de performance présumé de 40 % par rapport à ses modèles actuels. Cette sortie, si elle est confirmée, exercerait une pression significative sur ses rivaux Anthropic et Google, alors que la course pour construire des IA plus performantes s'intensifie et que le coût de la puissance de calcul s'envole.
« C'est le 'dernier kilomètre' de l'AGI, et ils sont prêts à tout sacrifier pour parier dessus », a déclaré une personne familière des discussions internes de l'entreprise, en référence à l'objectif de la firme d'atteindre l'intelligence artificielle générale. Ces informations, qui n'ont pas été officiellement confirmées par OpenAI, indiquent un virage stratégique spectaculaire au sein de l'entreprise soutenue par Microsoft.
Le nouveau modèle, portant le nom de code interne « Spud », est décrit comme une architecture nativement multimodale avec une fenêtre contextuelle de 2 millions de jetons, soit le double de celle des derniers modèles d'Anthropic. Les détails divulgués suggèrent que le modèle a terminé son pré-entraînement le 17 mars et qu'il est positionné pour unifier ChatGPT, Codex et un navigateur en un seul agent unifié, créant ainsi une « super application » de bureau.
Ce pivot stratégique semble être une réponse directe aux gains concurrentiels d'Anthropic, dont la série de modèles Claude aurait capturé des utilisateurs d'OpenAI, particulièrement dans les applications de codage. Pour alimenter les demandes computationnelles massives de GPT-6, OpenAI aurait annulé d'autres projets, y compris son modèle de texte-en-vidéo Sora, une décision qui a fait capoter un accord potentiel de 1 milliard de dollars avec Disney.
Un virage stratégique pour contrer les rivaux
La décision de consolider les ressources derrière un seul modèle phare reflète un réalignement stratégique important pour OpenAI. L'entreprise, qui a bénéficié d'une avance précoce avec ChatGPT, est confrontée à une pression croissante de la part de ses concurrents. Le succès des modèles spécifiques au codage d'Anthropic comme Claude Code et la montée en puissance de plateformes d'IA agentiques telles qu'OpenClaw, qui donnent aux modèles d'IA le contrôle des fonctions informatiques, ont souligné l'importance de la génération de code et des tâches basées sur des agents comme voie potentielle vers l'AGI.
Selon des sources internes, le cofondateur d'OpenAI, Greg Brockman, a reconnu que l'entreprise s'était auparavant trop concentrée sur les scores de référence (benchmarks) tout en perdant du terrain dans le domaine crucial de la programmation. Cette prise de conscience aurait déclenché une « alerte rouge programmation » au sein de l'entreprise à partir de décembre 2025, forçant le PDG Sam Altman à prendre la décision difficile de mettre fin aux gammes de produits non essentiels pour libérer les ressources de calcul indispensables au développement de GPT-6.
Le coût élevé de l'ambition
Ce pari présumé sur GPT-6 souligne un goulot d'étranglement critique dans l'industrie de l'IA : la rareté et le coût élevé de la puissance de calcul. Même pour une entreprise aussi bien financée qu'OpenAI, qui a récemment clôturé un tour de table la valorisant à 852 milliards de dollars, les exigences computationnelles pour l'entraînement et le déploiement de modèles de pointe nécessitent des sacrifices stratégiques. L'attention de l'entreprise se serait presque entièrement déplacée vers le renforcement de sa capacité de centres de données.
Cette contrainte à l'échelle de l'industrie constitue un vent arrière majeur pour les fournisseurs de matériel, en particulier Nvidia (NVDA), dont les GPU sont les principaux moteurs de l'entraînement des grands modèles de langage. La course pour sécuriser ces puces entraîne des dépenses d'investissement massives dans tout le secteur technologique. À mesure que les entreprises d'IA repoussent les limites de l'échelle et des capacités des modèles, leur succès dépend de plus en plus de leur capacité à se procurer et à gérer de vastes flottes de matériel spécialisé, faisant de la chaîne d'approvisionnement des puces IA un théâtre central de la compétition.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.