Công ty cơ sở hạ tầng suy luận đang cung cấp năng lượng cho các ứng dụng AI của Cursor, Abridge và OpenEvidence đã trở thành một trong những công ty tư nhân tăng trưởng nhanh nhất trong lĩnh vực công nghệ, với doanh thu tăng gấp khoảng 20 lần so với cùng kỳ năm trước khi các doanh nghiệp chuyển hướng chi tiêu cho mô hình sang các triển khai tùy chỉnh và mã nguồn mở.
Baseten, công ty suy luận AI có trụ sở tại San Francisco, đã chốt vòng gọi vốn Series F trị giá 1,5 tỷ USD do Altimeter Capital, Conviction và Spark Capital dẫn đầu, với Sands Capital và Wellington Management đóng vai trò đồng dẫn đầu. Vòng gọi vốn được cấu trúc thành hai đợt với mức định giá lần lượt là 13 tỷ USD và 11 tỷ USD — một cấu trúc ngày càng phổ biến trong các vòng gọi vốn AI có động lực mạnh, cho phép các nhóm nhà đầu tư khác nhau tham gia với các điều khoản đã được thương lượng.
"Tương lai của AI sẽ được xây dựng trên hàng triệu mô hình chuyên biệt, và các công ty xây dựng những mô hình tốt nhất biết rằng giai đoạn hậu huấn luyện đã trở nên mang tính sống còn," Tuhin Srivastava, CEO kiêm đồng sáng lập của Baseten, cho biết. "Đó là cách họ xây dựng trí thông minh mà họ sở hữu, trên dữ liệu của chính họ, được tối ưu hóa cho khách hàng mà họ phục vụ."
Nền tảng của Baseten hiện xử lý hơn 1 tỷ lượt suy luận mỗi ngày trên 87 cụm máy chủ trải dài 18 nhà cung cấp đám mây. Kiến trúc đa đám mây của công ty — một điểm bán hàng cốt lõi — cho phép các doanh nghiệp triển khai các mô hình mã nguồn mở từ Meta, Mistral và DeepSeek cùng với các mô hình biên giới độc quyền mà không bị khóa vào bất kỳ đám mây đơn lẻ nào. Theo Baseten, các công ty lớp ứng dụng hàng đầu hiện đang dành 30% đến 50% chi tiêu cho mô hình vào các mô hình tùy chỉnh và hậu huấn luyện, khi chất lượng mã nguồn mở hội tụ với các giải pháp thay thế độc quyền với chi phí chỉ bằng một phần nhỏ.
Nền tảng kỹ thuật là Truss, một framework mã nguồn mở đóng gói các mô hình máy học thành các API sản xuất với một tệp cấu hình duy nhất. Các nhà phát triển chỉ định mô hình, phần cứng và cài đặt tối ưu hóa trong một tệp YAML, và Baseten biên dịch một container TensorRT-LLM, triển khai nó trên mạng lưới đám mây và trả về một điểm cuối tương thích với OpenAI. Đối với các quy trình công việc AI phức hợp — các pipeline giọng nói kết nối các bước chuyển giọng nói thành văn bản, mô hình ngôn ngữ và chuyển văn bản thành giọng nói — lớp Truss Chains của nền tảng truyền dữ liệu trực tiếp giữa các bước mô hình, đạt độ trễ đầu-cuối dưới 400 mili giây.
Thị trường suy luận đang tăng trưởng kép nhanh hơn hầu hết mọi thứ chúng ta từng thấy
Vòng gọi vốn này đánh dấu một quỹ đạo định giá đáng chú ý. Baseten đã huy động 150 triệu USD Series D với định giá 2,15 tỷ USD vào tháng 9 năm 2025, tiếp theo là 300 triệu USD Series E với định giá 5 tỷ USD vào tháng 1 năm 2026, bao gồm 150 triệu USD từ Nvidia. Mức tăng định giá khoảng 6 lần trong vòng chưa đầy một năm phản ánh sự thay đổi cơ cấu trong kinh tế học AI: Deloitte dự báo vào tháng 11 năm 2025 rằng khối lượng công việc suy luận sẽ chiếm khoảng hai phần ba tổng sức mạnh tính toán AI vào năm 2026, tăng từ một phần ba của ba năm trước đó, với thị trường suy luận vượt quá 50 tỷ USD chỉ riêng chi tiêu cho chip trong năm nay.
Chi phí suy luận LLM đã giảm khoảng 1.000 lần kể từ cuối năm 2022, làm cho các ứng dụng tác nhân trở nên khả thi về mặt kinh tế ở quy mô sản xuất. Theo nghiên cứu của Sacra, ít nhất một khách hàng của Baseten báo cáo chi phí suy luận ở mức khoảng 30% so với những gì các giải pháp thay thế mã nguồn đóng tính phí cho khối lượng công việc tương đương.
"Tuhin và nhóm Baseten đã đặt cược cách đây sáu năm mà hầu hết mọi người chưa sẵn sàng thực hiện: rằng tương lai của AI sẽ được xây dựng trên nhiều mô hình chuyên biệt, và các công ty xây dựng chúng sẽ cần cơ sở hạ tầng đẳng cấp thế giới để biến chúng thành hiện thực," Apoorv Agrawal, đối tác tại Altimeter Capital, cho biết. "Canh bạc đó đang mang lại kết quả theo cách khó có thể nói quá."
Phân bổ vốn và định vị cạnh tranh
Baseten có kế hoạch tăng gấp ba lần số lượng nhân sự trong năm nay, đầu tư vào các đội ngũ kỹ thuật, nghiên cứu, vận hành và go-to-market doanh nghiệp. Công ty đã huy động hơn 2 tỷ USD cho đến nay từ các nhà đầu tư bao gồm Altimeter, Battery Ventures, Blackbird, Greylock, IVP, Nvidia, Spark Capital và Wellington Management.
Bối cảnh cạnh tranh bao gồm các siêu quy mô đám mây cung cấp dịch vụ suy luận được quản lý — Amazon Bedrock, Google Vertex AI và Microsoft Azure AI — cũng như các nhà cung cấp suy luận chuyên biệt như Together AI và Fireworks AI. Sự khác biệt của Baseten nằm ở tính độc lập đa đám mây và trọng tâm vào các mô hình tùy chỉnh và hậu huấn luyện thay vì năng lực suy luận chia sẻ cho các mô hình phổ biến. Công ty nhắm mục tiêu vào các doanh nghiệp không thể chịu đựng được sự biến động độ trễ của các điểm cuối chia sẻ và cần phân bổ GPU chuyên dụng cho các mô hình tinh chỉnh.
Đối với các nhà đầu tư, câu chuyện về Baseten phản ánh một luận điểm rộng hơn: khi các mô hình nền tảng trở thành hàng hóa, biên lợi nhuận bền vững trong AI đang dịch chuyển sang lớp cơ sở hạ tầng điều phối chúng. Quỹ đạo doanh thu của công ty — từ khoảng 200 triệu USD lên 600 triệu USD doanh thu chuẩn hóa hàng năm trong một quý duy nhất, theo các báo cáo trước đây — cho thấy thị trường đã đang định giá sự dịch chuyển đó. Khách hàng của Baseten bao gồm một số công ty AI tư nhân có giá trị nhất, và nền tảng của công ty nằm ở giao điểm của hai xu hướng cơ cấu: sự gia tăng của các mô hình chuyên biệt và nhu cầu của doanh nghiệp về tính linh hoạt đa đám mây.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.