La société d'infrastructure d'inférence qui alimente les applications d'IA de Cursor, Abridge et OpenEvidence est devenue l'une des entreprises privées à la croissance la plus rapide de la tech, avec un chiffre d'affaires bondissant d'environ 20 fois sur un an, alors que les entreprises orientent leurs dépenses de modélisation vers des déploiements personnalisés et open source.
Baseten, l'entreprise d'inférence IA basée à San Francisco, a bouclé un tour de financement de série F de 1,5 milliard de dollars mené par Altimeter Capital, Conviction et Spark Capital, avec Sands Capital et Wellington Management comme co-chefs de file. Le tour a été structuré en deux tranches, à des valorisations respectives de 13 milliards et 11 milliards de dollars — une structure de plus en plus courante dans les tours de financement IA à forte dynamique, permettant à différentes catégories d'investisseurs d'entrer à des conditions négociées.
« L'avenir de l'IA sera construit sur des millions de modèles spécialisés, et les entreprises qui construisent les meilleurs savent que le post-entraînement est devenu existentiel », a déclaré Tuhin Srivastava, PDG et cofondateur de Baseten. « C'est ainsi qu'elles construisent une intelligence qui leur appartient, sur des données qui sont les leurs, optimisées pour les clients qu'elles servent. »
La plateforme de Baseten traite désormais plus d'un milliard d'appels d'inférence chaque jour, répartis sur 87 clusters couvrant 18 fournisseurs de cloud. L'architecture multi-cloud de l'entreprise — un argument de vente central — permet aux entreprises de déployer des modèles open source de Meta, Mistral et DeepSeek aux côtés de modèles propriétaires de pointe, sans être verrouillées par un seul fournisseur cloud. Les principales sociétés de couche applicative dirigent désormais 30 % à 50 % de leurs dépenses de modélisation vers des modèles personnalisés et post-entraînés, selon Baseten, alors que la qualité de l'open source converge avec les alternatives propriétaires pour une fraction du coût.
Le socle technique est Truss, un framework open source qui empaquète les modèles d'apprentissage automatique en API de production avec un seul fichier de configuration. Les développeurs spécifient le modèle, le matériel et les paramètres d'optimisation dans un fichier YAML, et Baseten compile un conteneur TensorRT-LLM, le déploie sur son réseau cloud et renvoie un point d'accès compatible OpenAI. Pour les workflows d'IA composites — pipelines vocaux qui enchaînent des étapes de reconnaissance vocale, de modèle de langage et de synthèse vocale — la couche Truss Chains de la plateforme diffuse les données directement entre les étapes du modèle, atteignant une latence de bout en bout inférieure à 400 millisecondes.
Le marché de l'inférence croît plus rapidement que presque tout ce que nous avons vu
Ce tour de financement couronne une trajectoire de valorisation remarquable. Baseten avait levé 150 millions de dollars en série D à une valorisation de 2,15 milliards en septembre 2025, puis 300 millions de dollars en série E à 5 milliards en janvier 2026, dont 150 millions de dollars de Nvidia. Ce bond d'environ 6 fois la valorisation en moins d'un an reflète un changement structurel dans l'économie de l'IA : Deloitte prévoyait en novembre 2025 que les charges de travail d'inférence représenteraient environ les deux tiers de tous les calculs IA en 2026, contre un tiers trois ans plus tôt, le marché de l'inférence dépassant les 50 milliards de dollars en dépenses de puces cette année seulement.
Les coûts d'inférence des LLM ont chuté d'environ 1 000 fois depuis fin 2022, rendant les applications agentiques économiquement viables à l'échelle de la production. Au moins un client de Baseten déclare des coûts d'inférence d'environ 30 % de ce que facturent les alternatives propriétaires fermées pour des charges de travail équivalentes, selon les recherches de Sacra.
« Tuhin et l'équipe de Baseten ont fait un pari il y a six ans que la plupart des gens n'étaient pas prêts à faire : que l'avenir de l'IA serait construit sur de nombreux modèles spécialisés, et que les entreprises les construisant auraient besoin d'une infrastructure de classe mondiale pour les concrétiser », a déclaré Apoorv Agrawal, associé chez Altimeter Capital. « Ce pari porte ses fruits d'une manière difficile à exagérer. »
Déploiement du capital et positionnement concurrentiel
Baseten prévoit de tripler ses effectifs cette année, en investissant dans les équipes d'ingénierie, de recherche, d'exploitation et de commercialisation auprès des entreprises. La société a levé plus de 2 milliards de dollars à ce jour auprès d'investisseurs incluant Altimeter, Battery Ventures, Blackbird, Greylock, IVP, Nvidia, Spark Capital et Wellington Management.
Le paysage concurrentiel inclut les hyperscalers du cloud proposant des services d'inférence gérés — Amazon Bedrock, Google Vertex AI et Microsoft Azure AI — ainsi que des fournisseurs spécialisés comme Together AI et Fireworks AI. La différenciation de Baseten réside dans son indépendance multi-cloud et son accent sur les modèles personnalisés et post-entraînés, plutôt que sur la capacité d'inférence partagée pour les modèles populaires. L'entreprise cible les entreprises qui ne peuvent tolérer la variabilité de latence des points d'accès partagés et ont besoin d'allocations GPU dédiées pour les modèles affinés.
Pour les investisseurs, l'histoire de Baseten reflète une thèse plus large : à mesure que les modèles fondation se banalisent, la marge durable dans l'IA migre vers la couche d'infrastructure qui les orchestre. La trajectoire des revenus de l'entreprise — d'environ 200 à 600 millions de dollars annualisés en un seul trimestre, selon des rapports antérieurs — suggère que le marché intègre déjà ce changement. Les clients de Baseten incluent certaines des entreprises privées d'IA les plus valorisées, et sa plateforme se situe à l'intersection de deux tendances structurelles : la prolifération des modèles spécialisés et le besoin des entreprises de flexibilité multi-cloud.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.