Một nền kinh tế gig mới trả 15 USD mỗi giờ để ghi lại các công việc nhà đang thúc đẩy cuộc đua trị giá hàng tỷ USD nhằm chế tạo robot nhân hình.
Quay lại
Một nền kinh tế gig mới trả 15 USD mỗi giờ để ghi lại các công việc nhà đang thúc đẩy cuộc đua trị giá hàng tỷ USD nhằm chế tạo robot nhân hình.

Cuộc chạy đua tìm kiếm dữ liệu huấn luyện trong thế giới thực trên toàn ngành đã tạo ra một hình thức làm việc kỹ thuật số mới (gig work), với các công ty như Micro1 và Scale AI đang trả tiền cho hàng nghìn người trên toàn cầu để ghi lại cuộc sống hàng ngày của họ nhằm dạy các robot nhân hình từ Tesla và Figure AI cách vận hành trong thế giới vật lý. Thị trường lao động mới này trả cho công nhân khoảng 15 USD mỗi giờ để đeo iPhone lên đầu trong khi thực hiện các công việc nhà, làm nổi bật một nút thắt cổ chai quan trọng trong cuộc đua phát triển trí tuệ nhân tạo hiện hữu (embodied AI): sự thiếu hụt trầm trọng dữ liệu hành động vật lý cần thiết để làm cho robot trở nên hữu ích.
"Chúng tôi có lẽ cần hàng tỷ giờ dữ liệu," Arian Sadeghi, phó chủ tịch AI tại Micro1, cho biết, đồng thời lưu ý rằng bộ sưu tập 160.000 giờ video mỗi tháng hiện tại của công ty ông vẫn là chưa đủ. "Chúng tôi thậm chí còn chưa bắt đầu thu thập dữ liệu về sự tương tác giữa người với người. Hiện tại, nó chỉ là những công việc nhà cơ bản nhất."
Công việc này liên quan đến một lực lượng lao động toàn cầu gồm khoảng 4.000 người tại 71 quốc gia, những người tự ghi hình mình thực hiện các nhiệm vụ như dọn giường, rửa bát và gấp quần áo. Công nhân, những người phải sử dụng iPhone có trang bị LiDAR, gửi ít nhất 10 giờ cảnh quay mỗi tuần và sau đó được kiểm tra chất lượng. Quá trình này đáp ứng nhu cầu khổng lồ từ các công ty chế tạo robot, những đơn vị đã xác định rằng sau những đột phá trong kiến trúc mô hình AI, nguồn lực cạnh tranh chính hiện nay là số lượng khổng lồ dữ liệu tương tác trong thế giới thực.
Cơn sốt dữ liệu này đang thúc đẩy thị trường robot nhân hình toàn cầu dự kiến sẽ đạt 42,3 tỷ USD vào năm 2026, khi các công ty đua nhau đạt được tầm nhìn lâu nay về robot đa năng. Mặc dù dữ liệu là thiết yếu để huấn luyện, phương pháp thu thập nó đang đặt ra những câu hỏi đạo đức mới về bản chất của lao động trong kỷ nguyên AI, tạo ra một lực lượng lao động toàn cầu gồm những "công nhân bóng ma" (ghost workers) vận hành các hệ thống AI đằng sau bức màn của các thỏa thuận không tiết lộ.
Hoạt động trả tiền cho lao động thu nhập thấp để tạo dữ liệu huấn luyện đã được nhà nhân chủng học Mary Gray và nhà khoa học máy tính Siddharth Suri gọi là "công việc bóng ma" (ghost work), mô tả sức lao động tiềm ẩn của con người làm cho các hệ thống AI có vẻ như tự chủ. Khi công việc này chuyển từ các cú nhấp chuột trên màn hình sang các hành động vật lý ngoài màn hình, một số nhà nghiên cứu như Nick Couldry và Ulises Mejias lập luận rằng nó đại diện cho một hình thức "chủ nghĩa thực dân dữ liệu", nơi nguyên liệu thô của cuộc sống hàng ngày được chiết xuất từ các nhóm dân cư toàn cầu và được tinh chế thành tài sản có giá trị bởi một số ít công ty công nghệ.
Công nhân trong chuỗi cung ứng dữ liệu mới này, thường ở các quốc gia như Ấn Độ, Nigeria và Philippines, hoạt động với sự bất đối xứng thông tin đáng kể. Họ thường không biết dữ liệu của mình phục vụ cho khách hàng cụ thể nào hoặc nó sẽ được sử dụng và lưu trữ ra sao. Mức thù lao, mặc dù có tính cạnh tranh tại thị trường địa phương, chỉ là một phần nhỏ so với giá trị mà nó tạo ra cho các công ty robot được hỗ trợ bởi hàng tỷ USD vốn đầu tư mạo hiểm. Ravi Rajalingam, người sáng lập công ty dán nhãn dữ liệu Objectways, lưu ý rằng dữ liệu từ các hộ gia đình Mỹ có giá cao hơn, với việc công nhân đôi khi kiếm được gấp ba lần so với các đồng nghiệp ở Việt Nam hoặc Ấn Độ, vì các công ty robot giả định rằng người tiêu dùng Mỹ sẽ là những người đầu tiên mua máy móc.
Hoạt động thu thập dữ liệu gia đình âm thầm này là một mặt trận trong cuộc cạnh tranh địa chính trị lớn hơn nhiều nhằm giành ưu thế trong AI hiện hữu. Trong khi các startup Mỹ tập trung vào việc tìm kiếm dữ liệu cho các nhiệm vụ gia đình và nhà máy, Trung Quốc đang theo đuổi một cách tiếp cận dựa trên hệ sinh thái nhiều hơn. Trong một cuộc chạy bán marathon gần đây, các robot nhân hình Trung Quốc đã thể hiện những cải tiến đáng kể về tính tự chủ và độ tin cậy, với hàng chục đội hoàn thành lộ trình mà chỉ một vài đội có thể hoàn thành một năm trước đó. Sự tiến bộ này được hỗ trợ bởi sự ủng hộ của nhà nước và việc mở rộng sản xuất quy mô lớn; "siêu nhà máy trí tuệ hiện hữu" Lingyi iTech của Bắc Kinh đặt mục tiêu sản xuất 10.000 chiếc vào năm 2026 và 500.000 chiếc vào năm 2030.
Cuộc cạnh tranh cũng bao gồm một khía cạnh quân sự đáng kể. Tại Mỹ, các startup như Foundation Future Industries đã giành được các hợp đồng từ Lầu Năm Góc để thử nghiệm robot nhân hình cho các vai trò chiến đấu, với Eric Trump là cố vấn chiến lược. Trong khi đó, Nga đã thành lập một nhánh Lực lượng Hệ thống Không người lái chuyên biệt, và chính phủ Trung Quốc đang tích cực chuyển đổi các công ty công nghệ dân sự thành các nhà cung cấp quân sự. Cuộc đua không chỉ vì thị phần trong nhà và nhà máy, mà còn vì lợi thế chiến lược trên các chiến trường tương lai.
Về cốt lõi, nỗ lực thu thập dữ liệu toàn cầu này là nỗ lực quy mô lớn đầu tiên nhằm chiết xuất và số hóa cái mà nhà triết học Michael Polanyi gọi là "tri thức ẩn" (tacit knowledge) — những kỹ năng hiện hữu mang tính trực giác mà con người biết cách thực hiện mà không thể giải thích đầy đủ, như giữ thăng bằng, gấp đồ hoặc cảm nhận trọng lượng của một vật thể. Bằng cách ghi lại những hành động này, các công ty AI đang cố gắng tháo rời kiến thức cơ thể này thành dữ liệu máy tính có thể đọc được.
Nghịch lý này được thể hiện trong trải nghiệm của những công nhân như Zeus, một sinh viên y khoa ở Nigeria, người tự ghi hình mình đang dọn giường sau ca làm việc. Anh nói với các phóng viên rằng anh coi đó là một "cơ hội để để lại dấu ấn" và tham gia vào một điều gì đó quan trọng. Mặc dù sự đóng góp của anh là có thật, dấu ấn anh để lại là một tập hợp dữ liệu nắm bắt chuyển động, được mua bởi một công ty mà anh không thể gọi tên, để huấn luyện một robot mà anh có thể không bao giờ đủ khả năng mua. Tri thức đang bị tách rời khỏi người biết, đặt ra một câu hỏi chính trị cơ bản cho thời đại AI: khi chính trải nghiệm vật lý của bạn trở thành nguyên liệu thô, bạn thực sự sở hữu điều gì?
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.