Một báo cáo mới từ Guotai Haitong cho rằng nút thắt lớn nhất đối với AI hiện thân không còn là thuật toán mà là sự thiếu hụt dữ liệu trầm trọng, tạo ra một chu kỳ đầu tư 'cuốc và xẻng' mới.
Quay lại
Một báo cáo mới từ Guotai Haitong cho rằng nút thắt lớn nhất đối với AI hiện thân không còn là thuật toán mà là sự thiếu hụt dữ liệu trầm trọng, tạo ra một chu kỳ đầu tư 'cuốc và xẻng' mới.

Sự chuyển dịch mô hình từ AI dựa trên ngôn ngữ sang các 'mô hình thế giới' tương tác vật lý đang tạo ra một cơn sốt đầu tư vào cơ sở hạ tầng dữ liệu cơ bản cần thiết để đào tạo chúng. Theo một báo cáo mới của Guotai Haitong, nút thắt chính cho AI hiện thân không còn là các thuật toán mà là một khoảng cách dữ liệu khổng lồ, với nhu cầu dữ liệu tăng vọt lên quy mô exabyte. Điều này định vị các công ty thu thập, mô phỏng và xử lý dữ liệu là những nhân tố 'cuốc và xẻng' cốt lõi cho làn sóng trí tuệ nhân tạo tiếp theo.
'Những công ty đầu tiên lấp đầy khoảng trống dữ liệu này sẽ đóng vai trò là những người bán xẻng của kỷ nguyên AI vật lý, nắm giữ mức định giá cao đáng kể', báo cáo của Guotai Haitong cho biết.
Yêu cầu dữ liệu cho trí tuệ hiện thân lớn hơn nhiều bậc so với các mô hình ngôn ngữ lớn. Trong khi các LLM được đào tạo trên các tập dữ liệu văn bản và hình ảnh quy mô petabyte, thì robot tương tác với thế giới yêu cầu dữ liệu quy mô exabyte bao gồm các đặc tính vật lý của sự tương tác—lực, xúc giác và ma sát. Dữ liệu chất lượng cao, chuyên biệt này cực kỳ khan hiếm, tạo ra một nút thắt cơ bản cho toàn bộ ngành công nghiệp robot.
Sự khan hiếm này đang buộc phải đánh giá lại chuỗi giá trị robot. Trọng tâm đang chuyển dịch từ chính phần cứng robot sang các nhà cung cấp hạ tầng dữ liệu, những người có thể giải quyết vấn đề thu thập và xử lý. Xu hướng này có thể kích hoạt một dòng vốn đáng kể vào một phân khúc cổ phiếu AI mới tập trung vào các công cụ và dịch vụ dữ liệu, có tiềm năng mang lại lợi ích cho họ nhiều hơn so với các nhà sản xuất robot trong ngắn hạn.
Để thu hẹp khoảng cách dữ liệu, ngành công nghiệp đang theo đuổi ba con đường chính, mỗi con đường đều có những đánh đổi riêng biệt:
Dữ liệu thế giới thực: Được thu thập thông qua các thiết bị vận hành từ xa do con người điều khiển và bộ đồ bắt chuyển động, phương pháp này cung cấp dữ liệu có độ trung thực cao nhất vì nó chứa các tương tác vật lý thực thụ. Tuy nhiên, chi phí của nó rất cao, khó mở rộng và không thể bao quát tất cả các tình huống hiếm gặp. Các công ty như 1X Technologies ưu tiên phương pháp này, cho rằng đây là cách duy nhất để vượt qua khoảng cách 'Sim2Real'.
Dữ liệu tổng hợp & mô phỏng: Sử dụng các công cụ vật lý để tạo ra các tập dữ liệu khổng lồ, được dán nhãn hoàn hảo trong môi trường ảo. Cách tiếp cận này rẻ và có thể mở rộng, với các công ty như Galaxy General hướng tới tỷ lệ dữ liệu tổng hợp trên dữ liệu thực là 99 trên 1. Điểm yếu chính của nó là khoảng cách 'Sim2Real', nơi các mô hình được đào tạo trong mô phỏng không thể hoạt động đáng tin cậy trong thế giới thực do những khác biệt vật lý tinh vi.
Dữ liệu video: Một cách tiếp cận mới hơn sử dụng kho lưu trữ video internet khổng lồ để dạy các mô hình. Các công ty như Tesla và Figure AI đang chuyển hướng sang phương pháp này, tin rằng quy mô khổng lồ của dữ liệu video quan trọng hơn việc thiếu các thuộc tính vật lý trực tiếp. Thách thức nằm ở việc 'nâng chiều' video 2D thành hành động 3D, một rào cản kỹ thuật phức tạp.
Sự đồng thuận hiện nay là một cách tiếp cận hỗn hợp—sử dụng mô phỏng và video để đào tạo sơ bộ quy mô lớn, sau đó tinh chỉnh với dữ liệu thế giới thực chất lượng cao, quy mô nhỏ hơn—sẽ trở thành tiêu chuẩn của ngành.
Sự phân hóa chiến lược này có thể thấy rõ trong toàn ngành. Tesla nổi tiếng đã từ bỏ việc vận hành từ xa cho robot Optimus của mình, thay vào đó dựa vào video từ đội xe của mình. Figure AI, được hỗ trợ bởi OpenAI và Microsoft, đã khởi động 'Project Go-Big' để khám phá việc chuyển giao các kỹ năng từ video con người sang robot của mình bằng phương pháp zero-shot learning.
Ngược lại, các công ty khởi nghiệp như Zhìyuán Jīqìrén (智元机器人) tại Trung Quốc được báo cáo là đang sử dụng 100% dữ liệu thực tế để đào tạo các mô hình lớn của họ. Điều này làm nổi bật những ván cược chiến lược đang được thực hiện vào nguồn dữ liệu nào cuối cùng sẽ chứng minh hiệu quả nhất.
Xu hướng này còn mở rộng ra ngoài lĩnh vực robot. Gã khổng lồ fintech Ấn Độ Paytm, bất chấp tham vọng AI quy mô lớn, không có kế hoạch xây dựng trung tâm dữ liệu của riêng mình. Thay vào đó, họ sẽ thuê năng lực tính toán từ các nhà cung cấp như NVIDIA và chạy các mô hình độc quyền của mình trên hạ tầng bên thứ ba, như CEO Vijay Shekhar Sharma đã xác nhận trong cuộc họp báo cáo kết quả kinh doanh quý 4 năm tài chính 2026. Chiến lược này xác nhận giả thuyết 'người bán xẻng': ngay cả những ông lớn công nghệ cũng đang chọn làm khách hàng chứ không phải đối thủ cạnh tranh của các nhà cung cấp hạ tầng cốt lõi.
Thị trường đã bắt đầu thưởng cho những 'người bán xẻng'. Như đã thấy với sự bùng nổ kỳ lân AI của Châu Âu và các vòng gọi vốn khổng lồ như 2 tỷ USD mà Moonshot AI của Trung Quốc huy động được, các nhà đầu tư đang rót vốn vào các công ty cung cấp năng lực nền tảng. Theo báo cáo của Guotai Haitong, đầu tư đang tập trung vào bốn lĩnh vực chính:
Đối với các nhà đầu tư, điều này có nghĩa là những cơ hội hứa hẹn nhất trong không gian AI hiện thân có thể không phải là các công ty chế tạo robot, mà là những công ty bán dữ liệu và công cụ thiết yếu cần thiết để làm cho chúng trở nên thông minh.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.