Coinbase réduit ses dépenses IA de près de 50 % grâce à des modèles open-source chinois

Le directeur général de Coinbase, Brian Armstrong, a déclaré que l'entreprise avait réduit ses dépenses en intelligence artificielle de près de 50 % en définissant les modèles open-source chinois GLM 5.2 et Kimi 2.7 comme options par défaut via une passerelle LLM interne, tandis que l'utilisation des tokens continuait de croître de façon exponentielle.

« 91 % des ingénieurs n'atteignent jamais leur plafond d'utilisation, nous n'avons donc pas resserré les quotas — nous sommes passés à des modèles par défaut moins chers », a déclaré Armstrong dans un message publié sur X vendredi.

La plateforme d'échange de crypto-monnaies a déployé trois mesures de réduction des coûts : un système de routage intelligent qui prétraite les requêtes et attribue les tâches au modèle le plus rentable en fonction des taux de succès du cache et des prix ; une mise en cache agressive qui a fait passer le taux de succès de LibreChat de 5 % à 60 % ; et une rationalisation du contexte qui oblige les ingénieurs à démarrer de nouvelles sessions lorsqu'ils changent de tâche. Pour la planification et le raisonnement complexes, les ingénieurs peuvent toujours faire appel aux modèles de pointe, tandis que les révisions de code utilisent une stratégie multi-modèles parallèle où les résultats se vérifient mutuellement.

Ce changement valide la viabilité commerciale de l'IA open-source chinoise dans les environnements de production des entreprises occidentales, remettant directement en cause le pouvoir de fixation des prix de fournisseurs américains tels qu'OpenAI et Anthropic. Pour Coinbase, la réduction des coûts pourrait améliorer les marges et les indicateurs de rentabilité à un moment où l'entreprise élargit son utilisation de l'IA plutôt que de la restreindre.

Le routage intelligent remplace la sélection manuelle des modèles

Armstrong a déclaré que le framework de planification personnalisé de l'entreprise prétraite chaque requête, puis l'achemine automatiquement vers le modèle le plus adapté en fonction de la probabilité de succès du cache et du prix par token. L'objectif, a-t-il indiqué, est de laisser l'IA gérer la sélection des modèles plutôt que de la confier aux ingénieurs. Les tâches d'exécution, a-t-il argumenté, ne nécessitent pas les modèles de pointe les plus chers — seules les tâches de planification et de raisonnement le font.

La mise en cache et la discipline du contexte génèrent l'essentiel des économies

Coinbase exige désormais que toutes les requêtes IA soient conscientes du cache, ce qui signifie que le système vérifie si une réponse précédente peut être réutilisée avant d'en générer une nouvelle. La mise en œuvre de LibreChat illustre l'impact : les taux de succès du cache sont passés de 5 % à 60 % après l'optimisation. Armstrong a également exhorté les ingénieurs à garder des fenêtres de contexte légères — en démarrant de nouvelles sessions, en réduisant le périmètre des fichiers et en déconnectant les outils inutilisés — afin de réduire la consommation de tokens gaspillés.

L'entreprise n'a pas divulgué les chiffres absolus de ses dépenses. Mais le fait d'obtenir une réduction de près de 50 % alors que l'utilisation des tokens croît à un rythme exponentiel suggère que Coinbase a partiellement dissocié la consommation du coût.

Ce que cela signifie pour le marché de l'IA

L'adoption de GLM 5.2 — développé par Zhipu AI, basé à Pékin — et de Kimi 2.7 — de Moonshot AI, également basé à Pékin — comme modèles d'entreprise par défaut marque une étape importante pour l'IA open-source chinoise dans les infrastructures d'entreprise occidentales. GPT-4o d'OpenAI et Claude 4 d'Anthropic, qui pratiquent des prix premium, sont désormais confrontés à une alternative crédible à faible coût que les entreprises peuvent déployer sans sacrifier la qualité sur les tâches courantes.

Pour les investisseurs, l'implication est claire : si d'autres grandes entreprises suivent le modèle de Coinbase, le marché adressable des modèles d'IA américains premium pourrait se réduire aux seules tâches de haute complexité, comprimant les attentes de croissance des revenus pour les fournisseurs qui dépendent d'une adoption généralisée par les entreprises. Coinbase, qui est cotée au Nasdaq sous le symbole COIN, n'a pas divulgué le montant exact des économies réalisées, mais l'amélioration structurelle des coûts soutient l'expansion des marges à mesure que l'utilisation de l'IA monte en échelle.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.