Alibaba Group Holding Ltd. đã phát hành một mô hình trí tuệ nhân tạo được thiết kế để giúp robot nhận thức và tương tác với thế giới vật lý, gia nhập cuộc đua đang ngày càng nóng giữa các gã khổng lồ công nghệ Trung Quốc và các startup toàn cầu trong việc xây dựng "mô hình thế giới" vượt ra ngoài AI truyền thống dựa trên ngôn ngữ.
Mô hình này, có tên cụ thể và số lượng tham số không được tiết lộ, nhằm mục tiêu cung cấp cho robot khả năng hiểu không gian môi trường, mối quan hệ giữa các vật thể và động lực vật lý — những khả năng mà lâu nay vẫn nằm ngoài tầm với của các hệ thống thị giác-ngôn ngữ-hành động thông thường. Động thái của Alibaba diễn ra trong bối cảnh ngành công nghiệp AI đang chuyển trọng tâm từ các mô hình ngôn ngữ lớn sang các mô hình thế giới có khả năng mô phỏng và dự đoán các quy luật vật lý trong thế giới thực.
"Các mô hình thế giới đại diện cho ranh giới tiếp theo trong trí thông minh nhúng, đưa AI từ tạo sinh văn bản sang hiểu biết thế giới vật lý," ông Wang Xiaogang, Chủ tịch ACE ROBOTICS, phát biểu trong một tuyên bố hồi đầu tháng này. Mô hình thế giới mã nguồn mở Kairos của công ty ông gần đây đã đứng đầu bốn chuẩn mực trí thông minh nhúng toàn cầu, bao gồm điểm số 96,1% trên chuẩn mực thao tác hai tay RoboTwin 2.0.
Sự gia nhập của Alibaba đặt họ vào một lĩnh vực đang mở rộng nhanh chóng. Mô hình Kairos-4B của ACE ROBOTICS, với chỉ 4 tỷ tham số, đạt tổng điểm 9,30 trên chuẩn mực robot WorldModelBench, vượt qua các hệ thống có tới 28 tỷ tham số từ Nvidia Corp. và các hãng khác. World Labs của Fei-Fei Li, được định giá 1 tỷ USD, đã ra mắt ứng dụng Marble vào tháng 11, sử dụng các mô hình thế giới để tạo ra các bản sao 3D tương tác của không gian từ các gợi ý trực quan hoặc văn bản.
Bối cảnh cạnh tranh trải rộng cả Trung Quốc và Mỹ. Cosmos 3.0 của Nvidia, ra mắt trong năm nay, áp dụng kiến trúc hợp nhất tích hợp lý luận thị giác, tạo sinh thế giới và dự đoán hành động vào một hệ thống duy nhất — cùng triết lý thiết kế mà ACE ROBOTICS lần đầu tiên giới thiệu vào tháng 12 năm 2025. Mô hình của Alibaba sẽ cần đạt hoặc vượt các chuẩn mực này để thu hút được các nhà phát triển robot và nhà sản xuất phần cứng.
Đối với Alibaba, mô hình này mở rộng tham vọng AI của họ vượt ra ngoài điện toán đám mây và phần mềm doanh nghiệp. Công ty đã đầu tư mạnh vào dòng mô hình ngôn ngữ lớn Tongyi Qianwen (Qwen) và hiện đang thúc đẩy vào AI nhúng, một thị trường có thể mở ra các nguồn doanh thu mới trong tự động hóa công nghiệp, hậu cần và bán lẻ thông minh. Alibaba Cloud, mảng điện toán đám mây của công ty, sẽ là nền tảng tự nhiên để cung cấp mô hình này cho khách hàng doanh nghiệp.
Thị trường AI robot đại diện cho một cơ hội đáng kể. ACE ROBOTICS đã huy động được vài trăm triệu USD trong nửa đầu năm 2026 từ các nhà đầu tư bao gồm Geely Capital và Shenzhen Capital Group, cho thấy sự quan tâm mạnh mẽ của nhà đầu tư đối với trí thông minh nhúng. Quy mô và cơ sở hạ tầng đám mây hiện có của Alibaba có thể mang lại lợi thế phân phối so với các đối thủ nhỏ hơn, mặc dù hiệu suất của mô hình này so với các chuẩn mực đã được thiết lập vẫn chưa được xác minh.
Cổ phiếu Alibaba đã giao dịch cao hơn sau thông báo. Việc công ty thúc đẩy vào các mô hình thế giới định vị họ để cạnh tranh giành thị phần trong hệ sinh thái phần mềm robot đang phát triển, nơi khả năng tổng quát hóa trên các môi trường chưa từng thấy — ánh sáng, bố cục, vật thể và nhiễu cảm biến — vẫn là thách thức kỹ thuật trung tâm. Tuy nhiên, nếu không có kết quả chuẩn mực độc lập, còn quá sớm để đánh giá liệu mô hình của Alibaba có thể sánh ngang với điểm số tổng quát hóa cấp độ cảnh của những người dẫn đầu như Kairos, đã đạt 89,0 trên chuẩn mực LIBERO-Plus, hay hiệu suất tham số của các mô hình như Kairos-4B.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.