Công ty khởi nghiệp robot Physical Intelligence đang trong quá trình thảo luận cho một vòng gọi vốn mới nhằm định giá công ty ở mức gần 11 tỷ USD, gần gấp đôi so với định giá trước đó, sau một đột phá nghiên cứu trong đó mô hình AI mới của họ đã hướng dẫn một robot thực hiện các nhiệm vụ mà nó chưa từng được đào tạo. Mô hình mới của công ty hai năm tuổi này, π0.7, thể hiện cái mà họ gọi là "khái quát hóa tổ hợp", một khả năng được tìm kiếm từ lâu cho phép robot kết hợp các kỹ năng đã học trong các bối cảnh khác nhau để giải quyết các vấn đề mới, một bước tiến đáng kể hướng tới một bộ não robot đa năng.
Sergey Levine, đồng sáng lập của Physical Intelligence và là giáo sư tại UC Berkeley, cho biết: “Một khi nó vượt qua ngưỡng đó, từ việc chỉ làm chính xác những thứ mà bạn thu thập dữ liệu sang việc thực sự tái kết hợp mọi thứ theo những cách mới, các khả năng sẽ tăng lên theo cấp số nhân thay vì tuyến tính so với lượng dữ liệu”. Ông lưu ý rằng thuộc tính mở rộng này đã được nhìn thấy trong các lĩnh vực AI khác như ngôn ngữ và thị giác, gợi ý rằng lĩnh vực robot có thể đang ở một điểm bùng phát tương tự.
Khẳng định cốt lõi tập trung vào khả năng tổng hợp thông tin rời rạc của mô hình. Trong một buổi trình diễn quan trọng, π0.7 đã cho phép một robot sử dụng nồi chiên không dầu để nấu một củ khoai lang mặc dù dữ liệu đào tạo chỉ chứa hai đoạn ngắn, không liên quan đến thiết bị này. Mô hình này phù hợp với hiệu suất của các mô hình chuyên biệt, đơn nhiệm trong các công việc phức tạp như pha cà phê và gấp quần áo. Physical Intelligence đã huy động được hơn 1 tỷ USD cho đến nay và lần định giá gần nhất là 5,6 tỷ USD.
Tiến bộ công nghệ này có thể đẩy nhanh quá trình thương mại hóa robot đa năng, có khả năng làm gián đoạn các ngành công nghiệp từ sản xuất đến hậu cần. Đối với các nhà đầu tư, đây là một tín hiệu phát triển lớn trong lĩnh vực AI và robot có thể thúc đẩy thêm các hoạt động đầu tư và M&A. Tuy nhiên, công ty đã kiên quyết từ chối đưa ra lộ trình thương mại hóa, một lập trường không làm nản lòng các nhà đầu tư, một phần do danh tiếng của đồng sáng lập Lachy Groom, một nhà đầu tư thiên thần nổi tiếng từng hỗ trợ các công ty như Figma và Notion.
Từ Học Thuộc Lòng đến "Kỳ Lân ở Peru"
Đột phá với π0.7 đánh dấu sự chuyển hướng khỏi mô hình đào tạo robot tiêu chuẩn, vốn dựa vào việc thu thập các tập dữ liệu khổng lồ cho từng nhiệm vụ cụ thể — một hình thức học thuộc lòng. Bằng cách đạt được khả năng khái quát hóa tổ hợp, mô hình có thể suy luận cách thực hiện một nhiệm vụ mới bằng cách kết hợp các kiến thức dường như không liên quan trước đó. Levine đã so sánh kết quả đáng ngạc nhiên này với khoảnh khắc các nhà nghiên cứu lần đầu tiên thấy mô hình ngôn ngữ GPT-2 tạo ra một câu chuyện về kỳ lân ở dãy Andes, một sự kết hợp kỳ lạ mà nó chưa bao giờ được dạy một cách rõ ràng.
Ashwin Balakrishna, một nhà khoa học nghiên cứu tại Physical Intelligence, cho biết: “Kinh nghiệm của tôi luôn là khi tôi biết sâu về những gì có trong dữ liệu, tôi có thể đoán được mô hình sẽ có thể làm gì”. “Tôi hiếm khi ngạc nhiên. Nhưng vài tháng qua là lần đầu tiên tôi thực sự ngạc nhiên.”
Nhóm nghiên cứu vẫn thẳng thắn về những hạn chế hiện tại của mô hình. Nó chưa thể thực hiện các nhiệm vụ phức tạp, nhiều bước từ một lệnh cấp cao duy nhất như "làm cho tôi một ít bánh mì nướng". Tuy nhiên, nó vượt trội khi được hướng dẫn bằng các chỉ dẫn bằng lời nói từng bước, điều này cho thấy robot có thể được triển khai trong các môi trường mới và được hướng dẫn tại chỗ bởi con người mà không cần đào tạo lại. Trong một thử nghiệm, tỷ lệ thành công của nhiệm vụ nồi chiên không dầu đã tăng từ 5% lên 95% sau khi các nhà nghiên cứu dành 30 phút để tinh chỉnh các câu lệnh.
Câu Hỏi 11 Tỷ USD
Mặc dù nghiên cứu được trình bày với sự thận trọng, mô tả những "dấu hiệu sớm" của sự khái quát hóa, nhưng các tác động tài chính thì tức thời hơn. Các cuộc đàm phán được báo cáo cho một vòng gọi vốn mới định giá Physical Intelligence gần 11 tỷ USD nhấn mạnh sự khao khát mãnh liệt của nhà đầu tư đối với các công ty cho thấy những tiến bộ cơ bản trong AI. Định giá này đặc biệt đáng chú ý đối với một công ty chưa cam kết lịch trình triển khai sản phẩm.
Levine đã đẩy lùi những lời chỉ trích tiềm tàng rằng các nhiệm vụ được trình diễn là "nhàm chán" so với các video lan truyền về robot lộn nhào. Ông lập luận rằng sự khái quát hóa sẽ luôn trông kém kịch tính hơn một màn biểu diễn được dàn dựng cẩn thận, nhưng nó hữu ích hơn đáng kể và đại diện cho biên giới thực sự. Khả năng thu hút vốn tổ chức hàng đầu của công ty mà không có con đường rõ ràng dẫn đến doanh thu dựa trên niềm tin rằng việc giải quyết khả năng khái quát hóa robot là một giải thưởng mà người chiến thắng sẽ có tất cả.
Khi được hỏi về lộ trình triển khai trong thế giới thực, Levine từ chối suy đoán nhưng cho biết tiến độ "nhanh hơn tôi mong đợi vài năm trước". Đối với các nhà đầu tư, vụ cá cược không nằm ở một sản phẩm cụ thể mà ở ý tưởng rằng Physical Intelligence đang xây dựng "bộ não" nền tảng có một ngày nào đó có thể vận hành một loạt các hệ thống robot trên khắp nền kinh tế.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.