Các thử nghiệm ảo "hàng tỷ dặm" của Waymo báo hiệu bước tiến tiếp theo của AI
Các nhà phân tích của Morgan Stanley đã tuyên bố rằng AI đang chuyển đổi từ ngôn ngữ sang các mô hình có thể hiểu và mô phỏng thế giới vật lý. Một báo cáo mới từ ngân hàng đầu tư này đã định vị "Mô hình thế giới" là động lực tăng trưởng tiếp theo, giải quyết những thiếu sót của Mô hình ngôn ngữ lớn (LLM). Mặc dù LLM xuất sắc trong các nhiệm vụ như viết và lập trình, chúng lại gặp khó khăn với các vấn đề liên quan đến không gian ba chiều, thời gian và các định luật vật lý. Mô hình thế giới hoạt động như một "công cụ tưởng tượng" của AI, tạo ra các biểu diễn nội bộ của một môi trường để dự đoán kết quả và hậu quả.
Sự chuyển đổi này đã được áp dụng trong thực tế. Waymo đã sử dụng các mô hình thế giới dựa trên công nghệ Genie 3 của DeepMind để tiến hành các thử nghiệm đường bộ ảo "hàng tỷ dặm", đào tạo hệ thống của mình về các trường hợp đặc biệt hiếm và nguy hiểm. Tương tự, Microsoft đã trình diễn một phiên bản có thể chơi được, được AI kết xuất hoàn toàn của trò chơi Quake II năm 1997, nơi mô hình dự đoán từng khung hình dựa trên đầu vào của người chơi thay vì dựa vào một công cụ đồ họa truyền thống.
Các kỳ lân AI nổi lên với hơn 2,3 tỷ USD vốn hạt giống
Vốn đầu tư đang nhanh chóng đổ vào lĩnh vực mới này, tạo ra các kỳ lân tức thì do những nhân vật nổi bật nhất trong lĩnh vực dẫn dắt. Hai công ty khởi nghiệp điển hình cho xu hướng này là World Labs, do Fei-Fei Li thành lập năm 2023, và AMI Labs, do Yann LeCun đồng sáng lập, ra mắt vào tháng 3 năm 2026. Cả hai đã huy động được hơn 2,3 tỷ USD tài trợ giai đoạn đầu.
World Labs tập trung vào việc tạo ra các môi trường 3D bền vững, có thể khám phá từ các lời nhắc văn bản hoặc hình ảnh. Sản phẩm chủ lực của họ, Marble, ra mắt vào tháng 11 năm 2025, nhằm mục đích trở thành một trạm làm việc sáng tạo cho các nhà phát triển, cho phép họ xây dựng và chỉnh sửa thế giới ảo cho trò chơi, thiết kế và robot. Theo dữ liệu của PitchBook được trích dẫn trong báo cáo, World Labs đã huy động được khoảng 1,29 tỷ USD, đạt mức định giá sau đầu tư khoảng 5,4 tỷ USD sau vòng gọi vốn tháng 2 năm 2026.
AMI Labs đang theo đuổi một con đường khác dựa trên Kiến trúc dự đoán nhúng chung (JEPA) của LeCun. Thay vì kết xuất các cảnh quang chân thực, phương pháp này học cách dự đoán các trạng thái tương lai trong một không gian tiềm ẩn trừu tượng, ưu tiên hiệu quả và khả năng suy luận cho các ứng dụng trong robot và hệ thống tự hành. Vào tháng 3 năm 2026, AMI Labs đã công bố vòng hạt giống 1,03 tỷ USD, đảm bảo mức định giá hơn 4,5 tỷ USD, với nhà sáng lập Wit.ai Alex Lebrun giữ chức Giám đốc điều hành.
"Công cụ tưởng tượng" giới hạn trong vài phút tương tác ổn định
Mặc dù các ứng dụng tiềm năng trong trò chơi, tạo nội dung và hệ thống tự hành là rất đáng kể, báo cáo của Morgan Stanley đưa ra một đánh giá thận trọng về những thách thức kỹ thuật còn lại. Một trở ngại chính là sự tích lũy lỗi theo thời gian; ngay cả các mô hình tiên tiến như Google Genie 3 cũng chỉ có thể duy trì một mô phỏng ổn định, mạch lạc trong vài phút trước khi các vật thể và vật lý bắt đầu sai lệch.
Các rào cản lớn khác bao gồm thiếu kiểm soát chính xác đối với các môi trường được tạo ra, khó khăn trong việc mô phỏng các động lực xã hội phức tạp với nhiều tác nhân và thiếu các tiêu chuẩn đánh giá tiến độ được chuẩn hóa. Những hạn chế này cho thấy Mô hình thế giới có thể sẽ khuếch tán đầu tiên vào các ngành công nghiệp có khả năng chịu lỗi cao, chẳng hạn như nội dung số và trò chơi. Việc thâm nhập vào các lĩnh vực đòi hỏi độ chính xác vật lý nghiêm ngặt, như robot và xe tự hành, sẽ phụ thuộc vào việc giải quyết các vấn đề kỹ thuật cơ bản.