關鍵要點
- Physical Intelligence 的新 π0.7 模型展示了「組合泛化」能力,允許機器人無需特定訓練即可執行任務,這是邁向通用機器人的關鍵一步。
- 該公司正在洽談新一輪融資,儘管尚未確定商業化時間表,但其估值有望翻倍,達到 110 億美元。
- 該 AI 模型成功指導了一個機器人操作空氣炸鍋,儘管該任務幾乎沒有任何直接訓練數據,這甚至讓研究人員感到驚訝。
關鍵要點

機器人初創公司 Physical Intelligence 正在洽談新一輪融資,在該輪融資中,其估值將達到近 110 億美元,幾乎是此前估值的兩倍。此前,該公司的一項研究突破顯示,其新 AI 模型可以指揮機器人執行從未接受過訓練的任務。這家成立兩年的公司推出的新模型 π0.7 展示了其所謂的「組合泛化」能力,這是一種長期尋求的能力,允許機器人結合在不同場景下學習的技能來解決新問題,是邁向通用機器人大腦的重要一步。
「一旦跨越了那個門檻,即從只能機械地執行收集到的數據任務,到能夠以全新的方式重新組合這些任務,其能力將隨數據量的增長呈非線性上升,」Physical Intelligence 聯合創始人、加州大學柏克萊分校教授 Sergey Levine 表示。他指出,這種擴展屬性已經在語言和視覺等其他 AI 領域得到證實,表明機器人領域可能正處於類似的轉折點。
其核心主張集中在模型合成碎片化信息的能力。在一次關鍵演示中,π0.7 使機器人能夠使用空氣炸鍋烹飪紅薯,儘管訓練數據中只包含兩個與該設備相關的簡短、不相關的片段。該模型在沖咖啡和疊衣服等複雜家務中的表現與專門的單任務模型不相上下。截至目前,Physical Intelligence 已融資超過 10 億美元,上一次估值為 56 億美元。
這一技術進步可能會加速通用機器人的商業化,從而可能顛覆從製造業到物流業的各行各業。對於投資者而言,這標誌著 AI 和機器人領域的重大發展,可能推動進一步的投資和併購活動。然而,該公司明確拒絕提供商業化時間表,這種立場並未阻止投資者,部分原因是聯合創始人 Lachy Groom 的資歷,他曾是備受推崇的天使投資人,支持過 Figma 和 Notion 等公司。
π0.7 的突破標誌著對標準機器人訓練模式的背離,標準模式依賴於為每個特定任務收集海量數據集——這是一種死記硬背的形式。通過實現組合泛化,該模型可以通過結合先前的、看似不相關的知識來推斷如何執行新任務。Levine 將這種令人驚訝的結果比作研究人員第一次看到 GPT-2 語言模型生成關於安地斯山脈獨角獸的故事,這是一種從未明確教過的奇怪組合。
「我的經驗一直是,當我深入了解數據內容時,我大概能猜到模型能做什麼,」Physical Intelligence 的研究科學家 Ashwin Balakrishna 說。「我很少感到驚訝。但過去幾個月是第一次讓我感到真正的驚訝。」
研究團隊對模型目前的局限性保持坦誠。它還無法通過「給我烤片吐司」這樣單一的高級指令執行複雜的、多步驟的任务。然而,在分步驟的語音指導下,它表現出色,這表明機器人可以被部署到新環境中,由人類工人進行現場教學,而無需重新訓練。在一項實驗中,研究人員花費 30 分鐘優化提示後,空氣炸鍋任務的成功率從 5% 飆升至 95%。
儘管研究報告措辭謹慎,描述為泛化的「早期跡象」,但財務影響卻更為直接。據報導,Physical Intelligence 新一輪估值接近 110 億美元的談判凸顯了投資者對顯示出 AI 基礎性進展的公司有著強烈的胃口。對於一家尚未承諾產品部署計劃的公司來說,這一估值尤為引人注目。
Levine 反駁了潛在的批評,即與那些會後空翻機器人的爆紅視頻相比,演示的任務顯得「無聊」。他認為,泛化看起來總是比精心編排的特技不那麼富有戲劇性,但它要有用得多,代表了真正的領域前沿。該公司在沒有明確收入途徑的情況下吸引頂級機構資本的能力,源於這樣一種信念:解決機器人泛化問題是一個「贏家通吃」的獎項。
當被問及實際部署的時間表時,Levine 拒絕推測,但表示進展「比我幾年前預想的要快」。對於投資者來說,賭注不在於某個特定產品,而在於 Physical Intelligence 正在構建基礎的「大腦」,這個大腦有一天可能會為整個經濟領域的大量機器人系統提供動力。
本文僅供參考,不構成投資建議。