Waymo的「數十億英里」虛擬測試預示著人工智能的下一步
摩根士丹利分析師宣布,人工智能正從語言領域轉向能夠理解和模擬物理世界的模型。這家投資銀行的一份新報告將「世界模型」定位為下一個增長引擎,旨在解決大型語言模型(LLM)的不足。雖然LLM擅長寫作和編程等任務,但在涉及三維空間、時間以及物理定律的問題上表現不佳。世界模型充當AI的「想像引擎」,創建環境的內部表示,以預測結果和後果。
這種轉變已在實踐中。Waymo已利用基於DeepMind Genie 3技術的世界模型,進行了「數十億英里」的虛擬道路測試,在其系統上訓練了罕見且危險的邊緣情況。同樣,微軟展示了一個完全由AI渲染的可玩版1997年遊戲《Quake II》,其中模型根據玩家輸入預測每一幀,而不是依賴傳統的圖形引擎。
AI獨角獸以超過23億美元的種子資金嶄露頭角
投資者資本正迅速流入這一新領域,由該領域最傑出的人物領導,迅速催生了獨角獸企業。兩家初創公司是這一趨勢的典範:李飛飛於2023年創立的World Labs,以及Yann LeCun共同創立並於2026年3月揭開面紗的AMI Labs。它們總共獲得了超過23億美元的早期融資。
World Labs專注於從文本或圖像提示生成持久、可探索的3D環境。其旗艦產品Marble於2025年11月推出,旨在成為開發人員的創意工作站,允許他們為遊戲、設計和機器人技術構建和編輯虛擬世界。根據報告中引用的PitchBook數據,World Labs已籌集約12.9億美元,在2026年2月的融資後估值約為54億美元。
AMI Labs正在探索一條不同的路徑,基於LeCun的聯合嵌入預測架構(JEPA)。這種方法不是渲染逼真的場景,而是學習在抽象的潛在空間中預測未來狀態,優先考慮機器人技術和自主系統應用的效率和推理能力。2026年3月,AMI Labs宣布完成10.3億美元的種子輪融資,估值超過45億美元,Wit.ai創始人Alex Lebrun擔任首席執行官。
「想像引擎」僅限於幾分鐘的穩定交互
儘管在遊戲、內容創作和自主系統方面的潛在應用巨大,但摩根士丹利的報告對剩餘的技術挑戰進行了清醒的評估。一個主要障礙是隨時間累積的誤差;即使是像Google Genie 3這樣先進的模型,也只能在幾分鐘內保持穩定、連貫的模擬,之後物體和物理定律就會開始偏離。
其他主要障礙包括對生成環境缺乏精確控制、難以模擬具有多個代理的複雜社會動態,以及缺乏衡量進展的標準化基準。這些限制表明,世界模型最初可能會擴散到對錯誤容忍度較高的行業,例如數字內容和遊戲。滲透到需要嚴格物理準確性的領域,如機器人與自動駕駛汽車,將取決於解決這些基本工程問題。