关键要点
- Physical Intelligence 的新 π0.7 模型展示了“组合泛化”能力,允许机器人无需特定训练即可执行任务,这是迈向通用机器人的关键一步。
- 该公司正在洽谈新一轮融资,尽管尚未确定商业化时间表,但其估值有望翻倍,达到 110 亿美元。
- 该 AI 模型成功指导了一个机器人操作空气炸锅,尽管该任务几乎没有任何直接训练数据,这甚至让研究人员感到惊讶。
关键要点

机器人初创公司 Physical Intelligence 正在洽谈新一轮融资,在该轮融资中,其估值将达到近 110 亿美元,几乎是此前估值的两倍。此前,该公司的一项研究突破显示,其新 AI 模型可以指挥机器人执行从未接受过训练的任务。这家成立两年的公司推出的新模型 π0.7 展示了其所谓的“组合泛化”能力,这是一种长期寻求的能力,允许机器人结合在不同场景下学习的技能来解决新问题,是迈向通用机器人大脑的重要一步。
“一旦跨越了那个门槛,即从只能机械地执行收集到的数据任务,到能够以全新的方式重新组合这些任务,其能力将随数据量的增长呈非线性上升,”Physical Intelligence 联合创始人、加州大学伯克利分校教授 Sergey Levine 表示。他指出,这种扩展属性已经在语言和视觉等其他 AI 领域得到证实,表明机器人领域可能正处于类似的转折点。
其核心主张集中在模型合成碎片化信息的能力。在一次关键演示中,π0.7 使机器人能够使用空气炸锅烹饪红薯,尽管训练数据中只包含两个与该设备相关的简短、不相关的片段。该模型在冲咖啡和叠衣服等复杂家务中的表现与专门的单任务模型不相上下。截至目前,Physical Intelligence 已融资超过 10 亿美元,上一次估值为 56 亿美元。
这一技术进步可能会加速通用机器人的商业化,从而可能颠覆从制造业到物流业的各行各业。对于投资者而言,这标志着 AI 和机器人领域的重大发展,可能推动进一步的投资和并购活动。然而,该公司明确拒绝提供商业化时间表,这种立场并未阻止投资者,部分原因是联合创始人 Lachy Groom 的资历,他曾是备受推崇的天使投资人,支持过 Figma 和 Notion 等公司。
π0.7 的突破标志着对标准机器人训练模式的背离,标准模式依赖于为每个特定任务收集海量数据集——这是一种死记硬背的形式。通过实现组合泛化,该模型可以通过结合先前的、看似不相关的知识来推断如何执行新任务。Levine 将这种令人惊讶的结果比作研究人员第一次看到 GPT-2 语言模型生成关于安第斯山脉独角兽的故事,这是一种从未明确教过的奇怪组合。
“我的经验一直是,当我深入了解数据内容时,我大概能猜到模型能做什么,”Physical Intelligence 的研究科学家 Ashwin Balakrishna 说。“我很少感到惊讶。但过去几个月是第一次让我感到真正的惊讶。”
研究团队对模型目前的局限性保持坦诚。它还无法通过“给我烤片吐司”这样单一的高级指令执行复杂的、多步骤的任务。然而,在分步骤的语音指导下,它表现出色,这表明机器人可以被部署到新环境中,由人类工人进行现场教学,而无需重新训练。在一项实验中,研究人员花费 30 分钟优化提示后,空气炸锅任务的成功率从 5% 飙升至 95%。
尽管研究报告措辞谨慎,描述为泛化的“早期迹象”,但财务影响却更为直接。据报道,Physical Intelligence 新一轮估值接近 110 亿美元的谈判凸显了投资者对显示出 AI 基础性进展的公司有着强烈的胃口。对于一家尚未承诺产品部署计划的公司来说,这一估值尤为引人注目。
Levine 反驳了潜在的批评,即与那些会后空翻机器人的爆红视频相比,演示的任务显得“无聊”。他认为,泛化看起来总是比精心编排的特技不那么富有戏剧性,但它要有用得多,代表了真正的领域前沿。该公司在没有明确收入途径的情况下吸引顶级机构资本的能力,源于这样一种信念:解决机器人泛化问题是一个“赢家通吃”的奖项。
当被问及实际部署的时间表时,Levine 拒绝推测,但表示进展“比我几年前预想的要快”。对于投资者来说,赌注不在于某个特定产品,而在于 Physical Intelligence 正在构建基础的“大脑”,这个大脑有一天可能会为整个经济领域的大量机器人系统提供动力。
本文仅供参考,不构成投资建议。