Anthropic déploie Claude sur Azure avec les systèmes Nvidia Blackwell Ultra GB300

La famille de modèles d'IA Claude d'Anthropic est désormais généralement disponible sur Microsoft Azure, fonctionnant sur les systèmes GPU Nvidia Blackwell Ultra GB300 — le premier déploiement de la startup sur du matériel Nvidia et une étape importante dans le partenariat tripartite annoncé en novembre dernier.

« Ce déploiement est conçu pour améliorer les performances et l'efficacité de l'inférence tout en réduisant le coût total de possession pour les charges de travail d'IA en entreprise », a déclaré Anthropic dans un communiqué lundi. Les modèles fonctionnent sur les systèmes Nvidia GB300 NVL72 avec mise en réseau InfiniBand Quantum-X800, permettant aux clients de déployer des agents autonomes capables d'opérer à travers différentes fonctions commerciales.

La gamme initiale comprend Claude Opus 4.8 et Claude Haiku 4, Anthropic indiquant qu'elle continuera d'étendre la disponibilité des modèles sur Azure. Microsoft gère la facturation, l'authentification et la gouvernance via sa plateforme Foundry, réduisant ainsi la barrière d'intégration pour les entreprises déjà présentes dans l'écosystème Azure. Les systèmes GB300 NVL72 associent un processeur ARM à 72 cœurs au GPU Blackwell Ultra, une configuration que Nvidia utilise également dans son récent DGX Station de bureau — un poste de travail à 90 000–100 000 dollars doté de 748 Go de mémoire unifiée, capable d'exécuter des modèles à 70 milliards de paramètres en local.

L'accent technique porte sur les charges de travail d'agents autonomes. Grâce aux compétences d'agents vérifiées par Nvidia, les entreprises peuvent doter les agents Claude de capacités spécifiques à un domaine — intégrant ainsi les agents d'IA dans les flux de travail opérationnels plutôt que de les traiter comme des outils autonomes. Le Secure Agent Workspace Reference Design de Nvidia fournit des contrôles au niveau de l'infrastructure pour l'identité, la mise en réseau, les identifiants et les politiques d'exécution, une conception qui cible les secteurs réglementés tels que la finance, la santé et les services juridiques, où les exigences de conformité des données sont les plus strictes.

Le lancement commercial transforme l'accord-cadre de novembre 2025 entre Microsoft, Nvidia et Anthropic en un produit livrable. Pour Nvidia, ce déploiement valide le Blackwell Ultra GB300 en tant que plateforme d'inférence pour entreprises, au moment où les hyperscalers se précipitent pour sécuriser leur capacité GPU. Microsoft gagne un canal de distribution exclusif pour Claude sur Azure, renforçant sa position face à Amazon Web Services et Google Cloud sur le marché des agents d'IA. Pour Anthropic, le partenariat Azure offre une voie de distribution qui concurrence directement la relation d'OpenAI avec Microsoft — bien qu'OpenAI reste la charge de travail dominante sur l'infrastructure IA d'Azure.

Le marché des agents d'entreprise est l'enjeu crucial. Alors que les entreprises passent de l'expérimentation avec les grands modèles de langage au déploiement de systèmes de production qui automatisent des tâches commerciales complexes, la couche d'infrastructure qui soutient ces agents devient un goulot d'étranglement stratégique. Les systèmes GB300 de Nvidia, avec leur architecture mémoire unifiée et leur mise en réseau à haute bande passante, sont conçus pour gérer les exigences d'inférence des architectures multi-agents où des sous-agents spécialisés coordonnent leurs actions entre les départements. Bit Origin Ltd, une jeune entreprise d'infrastructure IA, a récemment acquis 16 serveurs Nvidia Blackwell B300 pour environ 11 millions de dollars, s'attendant à ce qu'ils génèrent environ 360 000 dollars de revenus mensuels — une donnée qui illustre le potentiel de revenus de l'infrastructure basée sur Blackwell.

Les actions Nvidia ont gagné plus de 140 % au cours des 12 derniers mois, se négociant à environ 35 fois les bénéfices à terme, alors que les dépenses d'IA des entreprises continuent de s'accélérer. Le Blackwell Ultra GB300 représente la dernière tentative de l'entreprise de défendre sa part estimée à 80 % du marché des accélérateurs d'IA face aux puces internes d'Amazon, Google et AMD. Pour les investisseurs, la question est de savoir si Nvidia peut maintenir son pouvoir de fixation des prix alors que les hyperscalers développent des alternatives personnalisées — ou si le passage aux charges de travail d'IA agentive crée une demande incrémentale suffisante pour absorber à la fois l'offre de Nvidia et celle de ses concurrents.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.