Theo CEO Momenta Cao Xudong, lái xe tự động là bài kiểm tra thực tế đầu tiên cho các mô hình AI mà cuối cùng sẽ cung cấp sức mạnh cho mọi thứ, từ robot đến hệ thống giao thông đô thị.
(Bắc Kinh) — Nhà cung cấp phần mềm lái xe tự động Momenta đang định vị mình là OpenAI của thế giới vật lý, tung ra một mô hình thế giới mới sử dụng dữ liệu từ hơn 800.000 phương tiện để dự đoán vật lý thế giới thực và hành vi của người lái xe. Mô hình R7 của công ty, được ra mắt tại Triển lãm ô tô Bắc Kinh 2026, là nền tảng cho cái mà Momenta gọi là “AI vật lý”, một công nghệ mà họ tin rằng sẽ mở rộng từ xe du lịch đến hậu cần và vận tải đường bộ.
“Lái xe tự động đã bước vào giai đoạn có thể đạt được vòng lặp phản hồi tích cực giữa dữ liệu và thương mại hóa,” Cao Xudong, CEO của Momenta, cho biết trong một cuộc phỏng vấn. “Nó là phần mở đầu cho AI vật lý vì đây là ứng dụng quy mô đầu tiên giải quyết các vấn đề về thu thập dữ liệu và mô hình kinh doanh vốn đã kìm hãm ngành robot.”
Mô hình thế giới R7 hoạt động theo ba lớp: đầu tiên nó đào tạo trước trên dữ liệu lái xe thực tế khổng lồ để hiểu các định luật vật lý và mối quan hệ nhân quả, sau đó sử dụng mô phỏng để dự đoán thế giới phát triển như thế nào dựa trên các hành động khác nhau, và cuối cùng sử dụng học tăng cường để đào tạo hệ thống đưa ra các quyết định tối ưu. Cấu trúc này được thiết kế để tạo ra một bộ não lái xe học hỏi từ trải nghiệm tập thể của đội xe, bao gồm hơn 70 mẫu xe từ các nhà sản xuất ô tô như Mercedes-Benz, Audi và BMW.
Chiến lược này đòi hỏi nguồn vốn khổng lồ, với việc Cao ước tính rằng việc đạt được khả năng tự hành Cấp độ 4 có quy mô sẽ cần ít nhất 10 tỷ USD vốn đầu tư. Bằng cách đảm bảo các hợp đồng sản xuất hàng loạt cho các hệ thống hỗ trợ người lái, Momenta đã xây dựng một doanh nghiệp có dòng tiền để tài trợ cho việc phát triển một mô hình AI thống nhất cho tất cả các loại phương tiện, một lợi thế then chốt so với các đối thủ cạnh tranh chỉ dựa vào nguồn vốn mạo hiểm.
Bánh đà AI vật lý
Cốt lõi trong chiến lược của Momenta là tạo ra một bánh đà dữ liệu khan hiếm trong thế giới vật lý. Trong khi AI kỹ thuật số bùng nổ nhờ dữ liệu văn bản và hình ảnh chi phí thấp, rộng lớn từ internet, việc đào tạo AI cho các tác vụ vật lý như cầm một chiếc cốc hoặc điều hướng trong khu vực xây dựng đòi hỏi phần cứng đắt tiền và tương tác thực tế. Tuy nhiên, xe tự hành là các nền tảng cảm biến di động liên tục thu thập dữ liệu phức tạp, giải quyết vấn đề khan hiếm dữ liệu.
“Mỗi chiếc trong số 800.000 phương tiện chúng tôi có trên đường là một nút thu thập dữ liệu,” Cao giải thích. “Các mô hình của OpenAI phát triển cùng với các truy vấn của người dùng; các mô hình của chúng tôi phát triển theo từng dặm lái xe trong thế giới thực.”
Dữ liệu này cung cấp cho mô hình thế giới R7, vượt xa sự bắt chước đơn giản đối với những người lái xe là con người. Theo Cao, dữ liệu thô chứa cả thói quen lái xe tốt và xấu. Sau khi đào tạo trước để học “lẽ thường” khi lái xe, mô hình sẽ trải qua giai đoạn đào tạo sau, tương tự như học tăng cường từ phản hồi của con người (RLHF) trong các mô hình ngôn ngữ, để điều chỉnh hành vi của nó phù hợp với một người lái xe lành nghề, an toàn chứ không phải một người trung bình.
Một nền tảng cho giải thưởng 10 tỷ USD
Tham vọng của Momenta không chỉ dừng lại ở việc trở thành nhà cung cấp Cấp 1 cho xe du lịch. Công ty đã áp dụng mô hình thống nhất của mình cho các phương tiện hậu cần Robovan và có kế hoạch thâm nhập thị trường Robotruck vào năm tới. Niềm tin cơ bản là một mô hình lái xe duy nhất, mạnh mẽ có thể thích ứng với bất kỳ loại phương tiện nào, tạo ra lợi thế nền tảng tương tự như những gì các công ty nền tảng đã đạt được trong thương mại điện tử.
“Chúng tôi tin rằng một mô hình lớn lái xe tự động có thể hiện thực hóa tất cả các ứng dụng dọc của lái xe tự động và thực hiện tốt hơn,” Cao nói. Cách tiếp cận này giúp giảm chi phí phát triển cho từng loại phương tiện mới trong khi dữ liệu từ mỗi phân khúc dọc—cho dù là taxi, hậu cần hay vận tải đường bộ—sẽ cải thiện mô hình cốt lõi cho tất cả mọi người.
Chiến lược nền tảng này là câu trả lời của Momenta cho chi phí gia nhập khổng lồ. Cao ước tính rằng việc phát triển một robot đa năng có thể đòi hỏi các khoản đầu tư lên tới hàng trăm tỷ đô la. Nếu không có hoạt động kinh doanh tạo ra dòng tiền tự duy trì, một dự án như vậy là không thực tế. Thành công của Momenta trên thị trường hỗ trợ lái xe, với hơn 200 mẫu xe đã ký kết, cung cấp động cơ tài chính để theo đuổi giải thưởng lớn hơn nhiều là quyền tự hành hoàn toàn.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.