人工智能先驱募资23亿美元，打造超越大语言模型的“世界模型”

Waymo的“数十亿英里”虚拟测试预示着人工智能的下一步

摩根士丹利分析师宣布，人工智能正从语言领域转向能够理解和模拟物理世界的模型。这家投资银行的一份新报告将“世界模型”定位为下一个增长引擎，旨在解决大型语言模型（LLM）的不足。虽然LLM擅长写作和编程等任务，但在涉及三维空间、时间以及物理定律的问题上表现不佳。世界模型充当AI的“想象引擎”，创建环境的内部表示，以预测结果和后果。

这种转变已在实践中。Waymo已利用基于DeepMind Genie 3技术的世界模型，进行了“数十亿英里”的虚拟道路测试，在其系统上训练了罕见且危险的边缘情况。同样，微软展示了一个完全由AI渲染的可玩版1997年游戏《Quake II》，其中模型根据玩家输入预测每一帧，而不是依赖传统的图形引擎。

AI独角兽以超过23亿美元的种子资金崭露头角

投资者资本正迅速流入这一新领域，由该领域最杰出的人物领导，迅速催生了独角兽企业。两家初创公司是这一趋势的典范：李飞飞于2023年创立的World Labs，以及Yann LeCun共同创立并于2026年3月揭开面纱的AMI Labs。它们总共获得了超过23亿美元的早期融资。

World Labs专注于从文本或图像提示生成持久、可探索的3D环境。其旗舰产品Marble于2025年11月推出，旨在成为开发人员的创意工作站，允许他们为游戏、设计和机器人技术构建和编辑虚拟世界。根据报告中引用的PitchBook数据，World Labs已筹集约12.9亿美元，在2026年2月的融资后估值约为54亿美元。

AMI Labs正在探索一条不同的路径，基于LeCun的联合嵌入预测架构（JEPA）。这种方法不是渲染逼真的场景，而是学习在抽象的潜在空间中预测未来状态，优先考虑机器人技术和自主系统应用的效率和推理能力。2026年3月，AMI Labs宣布完成10.3亿美元的种子轮融资，估值超过45亿美元，Wit.ai创始人Alex Lebrun担任首席执行官。

“想象引擎”仅限于几分钟的稳定交互

尽管在游戏、内容创作和自主系统方面的潜在应用巨大，但摩根士丹利的报告对剩余的技术挑战进行了清醒的评估。一个主要障碍是随时间积累的误差；即使是像Google Genie 3这样先进的模型，也只能在几分钟内保持稳定、连贯的模拟，之后物体和物理定律就会开始偏离。

其他主要障碍包括对生成环境缺乏精确控制、难以模拟具有多个代理的复杂社会动态，以及缺乏衡量进展的标准化基准。这些限制表明，世界模型最初可能会扩散到对错误容忍度较高的行业，例如数字内容和游戏。渗透到需要严格物理准确性的领域，如机器人和自动驾驶汽车，将取决于解决这些基本工程问题。