Waymo的“数十亿英里”虚拟测试预示着人工智能的下一步
摩根士丹利分析师宣布,人工智能正从语言领域转向能够理解和模拟物理世界的模型。这家投资银行的一份新报告将“世界模型”定位为下一个增长引擎,旨在解决大型语言模型(LLM)的不足。虽然LLM擅长写作和编程等任务,但在涉及三维空间、时间以及物理定律的问题上表现不佳。世界模型充当AI的“想象引擎”,创建环境的内部表示,以预测结果和后果。
这种转变已在实践中。Waymo已利用基于DeepMind Genie 3技术的世界模型,进行了“数十亿英里”的虚拟道路测试,在其系统上训练了罕见且危险的边缘情况。同样,微软展示了一个完全由AI渲染的可玩版1997年游戏《Quake II》,其中模型根据玩家输入预测每一帧,而不是依赖传统的图形引擎。
AI独角兽以超过23亿美元的种子资金崭露头角
投资者资本正迅速流入这一新领域,由该领域最杰出的人物领导,迅速催生了独角兽企业。两家初创公司是这一趋势的典范:李飞飞于2023年创立的World Labs,以及Yann LeCun共同创立并于2026年3月揭开面纱的AMI Labs。它们总共获得了超过23亿美元的早期融资。
World Labs专注于从文本或图像提示生成持久、可探索的3D环境。其旗舰产品Marble于2025年11月推出,旨在成为开发人员的创意工作站,允许他们为游戏、设计和机器人技术构建和编辑虚拟世界。根据报告中引用的PitchBook数据,World Labs已筹集约12.9亿美元,在2026年2月的融资后估值约为54亿美元。
AMI Labs正在探索一条不同的路径,基于LeCun的联合嵌入预测架构(JEPA)。这种方法不是渲染逼真的场景,而是学习在抽象的潜在空间中预测未来状态,优先考虑机器人技术和自主系统应用的效率和推理能力。2026年3月,AMI Labs宣布完成10.3亿美元的种子轮融资,估值超过45亿美元,Wit.ai创始人Alex Lebrun担任首席执行官。
“想象引擎”仅限于几分钟的稳定交互
尽管在游戏、内容创作和自主系统方面的潜在应用巨大,但摩根士丹利的报告对剩余的技术挑战进行了清醒的评估。一个主要障碍是随时间积累的误差;即使是像Google Genie 3这样先进的模型,也只能在几分钟内保持稳定、连贯的模拟,之后物体和物理定律就会开始偏离。
其他主要障碍包括对生成环境缺乏精确控制、难以模拟具有多个代理的复杂社会动态,以及缺乏衡量进展的标准化基准。这些限制表明,世界模型最初可能会扩散到对错误容忍度较高的行业,例如数字内容和游戏。渗透到需要严格物理准确性的领域,如机器人和自动驾驶汽车,将取决于解决这些基本工程问题。