Nhà cung cấp hạ tầng AI Trung Quốc Infinigence AI đã công bố vòng gọi vốn trị giá hơn 700 triệu nhân dân tệ (96,5 triệu đô la) để giải quyết vấn đề tương thích chip-mô hình quan trọng của ngành AI, thách thức sự thống trị phần mềm của các nhà sản xuất phần cứng như Nvidia. Công ty hiện được định giá cao hơn đáng kể với tổng số vốn huy động gần 2,2 tỷ nhân dân tệ, cung cấp một lớp trung gian (middleware) cho phép các mô hình AI chạy hiệu quả trên nhiều loại phần cứng, một yếu tố quan trọng khi nhu cầu tính toán tăng vọt.
"Chúng tôi hoạt động như một 'lưới điện' cho tính toán, trừu tượng hóa lớp phần cứng phức tạp và phân mảnh cho các nhà phát triển mô hình," đồng sáng lập và CEO Wang Yu đã tuyên bố trước đó khi định hình sứ mệnh của công ty. Vòng gọi vốn mới này do Hangzhou High-tech Jin Tou Group và Huiyuan Capital đồng dẫn đầu.
Nền tảng Agentic MaaS của Infinigence AI đã chứng minh khả năng tăng thông lượng hệ thống lên gấp hai đến ba lần trong khi cắt giảm độ trễ xuống 50%, theo dữ liệu của công ty. Nền tảng này duy trì sự liên kết độ chính xác hơn 99,9% so với các mô hình gốc và đã chứng kiến khối lượng Token hàng ngày tăng hơn 20 lần kể từ cuối năm ngoái, khai thác nhu cầu hàng ngày của Trung Quốc hơn 140 nghìn tỷ Token tính đến tháng Ba.
Khoản đầu tư làm nổi bật sự chuyển dịch then chốt từ việc tính phí dựa trên thời gian thuê GPU sang một "nền kinh tế Token", nơi hiệu quả là tối quan trọng. Bằng cách tối ưu hóa quá trình xử lý, Infinigence AI có thể cung cấp nhiều Token hiệu quả hơn từ cùng một phần cứng, một đề xuất giá trị đã thu hút vốn nhà nước và các đối tác chiến lược như nhà vận hành trung tâm dữ liệu Qin淮数据. Điều này thách thức trực tiếp cách tiếp cận "khu vườn khép kín" của hệ sinh thái CUDA của Nvidia, vốn khóa người dùng vào phần cứng của mình.
Vấn đề "M x N"
Vấn đề cốt lõi mà Infinigence AI giải quyết là tình thế tiến thoái lưỡng nan "M x N": hàng chục kiến trúc mô hình lớn (M) phải được điều chỉnh để chạy trên vô số hệ sinh thái chip AI không tương thích (N). Quá trình di chuyển này tạo ra chi phí thời gian và R&D đáng kể cho các nhà phát triển mô hình, một điểm nghẽn mà lớp trung gian của Infinigence nhằm loại bỏ bằng cách tạo ra một lớp dịch thuật phổ quát.
Danh sách nhà đầu tư tiết lộ một chiến lược công nghiệp có tính toán. Khoản đầu tư dẫn đầu từ Hangzhou High-tech Jin Tou Group, một quỹ liên kết với nhà nước, cho thấy ý định của chính phủ nhằm tối đa hóa hiệu quả của các khoản đầu tư khổng lồ vào hạ tầng tính toán công cộng. Bằng cách tài trợ cho một lớp hạ tầng "mềm", chính quyền có thể tận dụng tốt hơn bộ sưu tập đa dạng các loại chip sản xuất trong nước và nước ngoài, ngăn chặn sự phụ thuộc vào nhà cung cấp và cải thiện tỷ suất hoàn vốn cho các sáng kiến AI quốc gia.
Một lĩnh vực đông đúc
Bất chấp sự tăng trưởng nhanh chóng, Infinigence AI phải đối mặt với những trở ngại đáng kể. Các gã khổng lồ phần cứng như Nvidia đang liên tục tăng cường các ngăn xếp phần mềm và phần cứng tích hợp của họ, khiến các bên thứ ba cung cấp lớp trung gian khó chứng minh giá trị hơn. Để thành công, Infinigence phải chứng minh được những cải thiện hiệu suất không thể thay thế trong tối ưu hóa trình biên dịch và toán tử cấp sâu. Hơn nữa, khi khối lượng công việc AI chuyển từ đám mây sang các thiết bị biên như ô tô và robot, công ty sẽ cần chứng minh kiến trúc của mình có thể quản lý hiệu quả các mạng lưới tính toán phi tập trung, bị hạn chế về năng lượng.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.