Les coûts d'inférence quadruplent à 8,4 milliards de dollars, déraillant les objectifs de profit
Les modèles de rentabilité des principales entreprises d'intelligence artificielle sont soumis à une forte pression à mesure que le coût de fonctionnement de leurs services augmente. OpenAI et Anthropic ont toutes deux manqué leurs objectifs de marge brute interne en raison de coûts d'inférence plus élevés que prévu – la dépense liée à l'utilisation de serveurs cloud pour générer des réponses aux utilisateurs. L'année dernière, la marge brute d'OpenAI est tombée à 33% contre 40%, bien en dessous de sa prévision de 46%. Anthropic est également confrontée à des défis, sa marge brute projetée de 40% pour 2025 se situant désormais 10 points de pourcentage en dessous de son objectif initial.
Les dépassements de coûts sont frappants. Les coûts d'inférence d'OpenAI ont quadruplé l'année dernière pour atteindre 8,4 milliards de dollars, dépassant sa projection de 6,6 milliards de dollars. La société a attribué cette augmentation à une demande de service plus élevée que prévu, ce qui l'a forcée à acheter une capacité de serveur à la demande plus coûteuse. De même, les coûts d'inférence d'Anthropic devraient plus que tripler pour atteindre 2,7 milliards de dollars en 2025. Cette inflation des coûts est particulièrement notable car elle se produit alors que les prix globaux du cloud computing sont en baisse et que les deux entreprises affirment améliorer l'efficacité de leurs modèles.
Les utilisateurs gratuits et l'outil vidéo Sora mettent les finances à rude épreuve
La pression financière d'OpenAI est fortement aggravée par sa base massive d'utilisateurs non payants. Sur ses quelque 910 millions d'utilisateurs actifs hebdomadaires, seulement environ 5% sont des clients payants. L'année dernière, ces utilisateurs gratuits ont représenté 3,9 milliards de dollars de coûts d'inférence, soit près de la moitié du total de l'entreprise. Cette dynamique force les abonnés payants et les clients d'entreprise à subventionner la grande majorité de l'utilisation de la plateforme.
Le mix produit est également un facteur de coût majeur. Les outils gourmands en calcul comme Sora, le modèle de génération vidéo d'OpenAI, consomment beaucoup plus de ressources serveur que de simples requêtes textuelles. La société a également absorbé des coûts importants en offrant un accès illimité à des fonctionnalités puissantes, telles que la capacité du modèle populaire GPT-4o à créer des images stylisées, ce qui a temporairement entraîné un pic massif de consommation de ressources informatiques.
La rentabilité des utilisateurs payants s'améliore à 70%
Malgré la compression globale des marges, OpenAI a démontré des gains d'efficacité significatifs avec son segment de clientèle payante. La marge de l'entreprise sur les revenus des utilisateurs payants, après déduction des coûts de fonctionnement du modèle, s'est améliorée pour atteindre environ 70% en octobre de l'année dernière. Cela représente une augmentation substantielle par rapport aux 52% de la fin de l'année précédente et aux 35% de janvier 2024, suggérant que le modèle commercial de base est viable si la monétisation peut être étendue.
Pour remédier à ce déséquilibre, OpenAI recherche de nouvelles sources de revenus, notamment la publicité et des niveaux d'abonnement étendus. En janvier, la société a lancé un abonnement ChatGPT pris en charge par la publicité pour environ 5 à 8 dollars par mois. À l'avenir, OpenAI prévoit d'atteindre une marge brute de 67% d'ici 2030, date à laquelle elle s'attend à ce que 94% de ses 850 milliards de dollars de coûts d'inférence soient dédiés au service des clients payants. Atteindre cet objectif à long terme tout en gérant les dépenses incontrôlées à court terme reste le défi central pour le leader de l'IA.