Một vòng gọi vốn giai đoạn đầu đáng kể cho một công ty khởi nghiệp hạ tầng AI báo hiệu sự chuyển dịch thị trường từ chi phí đào tạo mô hình tốn kém sang kinh tế học của việc vận hành chúng. Vào ngày 20 tháng 5, nhà cung cấp hạ tầng AI Qijing Technology thông báo đã kết thúc vòng Pre-A trị giá vài trăm triệu nhân dân tệ, được dẫn dắt bởi StarLink Capital và Huakong Technology, với sự tham gia của cổ đông hiện hữu Hillhouse Capital.
Khoản tài trợ lớn trong một thị trường đầu tư mạo hiểm thận trọng cho thấy sự tập trung của nhà đầu tư đang chuyển từ cuộc đua mô hình "càng lớn càng tốt" sang những thách thức thực tế của việc triển khai thương mại. Thị trường hiện đang thưởng cho những công ty có thể giải quyết chi phí cao và thường kém hiệu quả liên quan đến việc sử dụng các mô hình AI ở quy mô lớn, một quy trình được gọi là suy luận.
Luận điểm cốt lõi của Qijing là sự tập trung của ngành vào Mô hình dưới dạng dịch vụ (MaaS) là không đúng chỗ. Thay vào đó, họ cung cấp Token dưới dạng dịch vụ (TaaS), liên kết trực tiếp đơn vị đầu ra của AI với chi phí. Công ty nhắm vào một sự kém hiệu quả nghiêm trọng trong triển khai AI: sử dụng phần cứng. Các phương pháp suy luận truyền thống phụ thuộc nặng nề vào bộ nhớ GPU đắt tiền, để lại nhiều CPU và RAM tiêu chuẩn của hệ thống ở trạng thái nhàn rỗi, với hiệu suất sử dụng phần cứng tổng thể thường dưới 20%. Kiến trúc "Liuhe" và công nghệ "Yuebing" của Qijing nhằm giải quyết vấn đề này bằng cách thiết kế lại cách quản lý KV Cache, một thành phần chính trong xử lý AI, từ đó giảm sự phụ thuộc vào các GPU tốn kém. Công ty đã cung cấp dịch vụ suy luận cho các mô hình lớn như GLM của Zhipu, xử lý gần một nghìn tỷ token mỗi ngày.
Sự tập trung vào hiệu quả này xuất hiện khi ngành công nghiệp AI đối mặt với những chi phí ẩn của việc mở rộng quy mô. Trong khi các mô hình ngôn ngữ lớn (LLM) được đào tạo trên hàng nghìn tỷ tham số rất mạnh mẽ, chúng lại tốn kém khi vận hành và có thể kém hiệu quả cho nhiều nhiệm vụ. Một số doanh nghiệp nhận thấy rằng các mô hình nhỏ hơn, gọn hơn có thể mang lại sự cân bằng tốt hơn giữa hiệu suất và chi phí, phản hồi nhanh hơn từ 5 đến 10 lần so với các mô hình lớn hơn cho một số ứng dụng nhất định. Điều này đã tạo ra một cơ hội thương mại rõ ràng cho các nhà cung cấp hạ tầng có thể tối ưu hóa tổng chi phí sở hữu, vượt ra ngoài chi phí mô hình trả trước để bao gồm các chi phí liên tục như bảo trì, giám sát và tiêu thụ năng lượng.
Chiến trường cạnh tranh mới
Nhu cầu tối ưu hóa suy luận càng trở nên cấp thiết do sự mất cân bằng cung cầu về năng lượng tính toán. Vào tháng 3 năm 2026, các nhà cung cấp lớn như Tencent Cloud, Alibaba Cloud và Baidu Smart Cloud đã tăng giá các dịch vụ tính toán AI, với một số chi phí mô hình tăng hơn 460%. Môi trường này tạo ra một cơ hội đáng kể cho các công ty chuyên biệt như Qijing.
Tuy nhiên, công ty phải đối mặt với một lĩnh vực đông đúc. Không gian hạ tầng AI không chỉ bao gồm các công ty khởi nghiệp được hỗ trợ bởi vốn mạo hiểm khác như Silicon Flow và MoreThanAI mà còn cả những gã khổng lồ đám mây đáng gờm. Các gã khổng lồ công nghệ như Alibaba Cloud, Huawei Cloud và Volcano Engine của ByteDance đều đang xây dựng các khả năng hạ tầng AI toàn diện của riêng họ. Để thành công, Qijing phải sử dụng khoản tài trợ của mình để xây dựng một hào kỹ thuật đủ sâu và đảm bảo lòng trung thành của khách hàng trước khi các đại gia có thể lấp đầy khoảng trống hoặc cung cấp các dịch vụ đi kèm "đủ tốt" cho thị trường đại chúng. Thành công của công ty sẽ phụ thuộc vào khả năng biến lợi thế kỹ thuật thành tăng trưởng thương mại bền vững trong một ngành đang phát triển nhanh chóng.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.