人工智能先驅募資23億美元，打造超越大型語言模型的「世界模型」

Waymo的「數十億英里」虛擬測試預示著人工智能的下一步

摩根士丹利分析師宣布，人工智能正從語言領域轉向能夠理解和模擬物理世界的模型。這家投資銀行的一份新報告將「世界模型」定位為下一個增長引擎，旨在解決大型語言模型（LLM）的不足。雖然LLM擅長寫作和編程等任務，但在涉及三維空間、時間以及物理定律的問題上表現不佳。世界模型充當AI的「想像引擎」，創建環境的內部表示，以預測結果和後果。

這種轉變已在實踐中。Waymo已利用基於DeepMind Genie 3技術的世界模型，進行了「數十億英里」的虛擬道路測試，在其系統上訓練了罕見且危險的邊緣情況。同樣，微軟展示了一個完全由AI渲染的可玩版1997年遊戲《Quake II》，其中模型根據玩家輸入預測每一幀，而不是依賴傳統的圖形引擎。

AI獨角獸以超過23億美元的種子資金嶄露頭角

投資者資本正迅速流入這一新領域，由該領域最傑出的人物領導，迅速催生了獨角獸企業。兩家初創公司是這一趨勢的典範：李飛飛於2023年創立的World Labs，以及Yann LeCun共同創立並於2026年3月揭開面紗的AMI Labs。它們總共獲得了超過23億美元的早期融資。

World Labs專注於從文本或圖像提示生成持久、可探索的3D環境。其旗艦產品Marble於2025年11月推出，旨在成為開發人員的創意工作站，允許他們為遊戲、設計和機器人技術構建和編輯虛擬世界。根據報告中引用的PitchBook數據，World Labs已籌集約12.9億美元，在2026年2月的融資後估值約為54億美元。

AMI Labs正在探索一條不同的路徑，基於LeCun的聯合嵌入預測架構（JEPA）。這種方法不是渲染逼真的場景，而是學習在抽象的潛在空間中預測未來狀態，優先考慮機器人技術和自主系統應用的效率和推理能力。2026年3月，AMI Labs宣布完成10.3億美元的種子輪融資，估值超過45億美元，Wit.ai創始人Alex Lebrun擔任首席執行官。

「想像引擎」僅限於幾分鐘的穩定交互

儘管在遊戲、內容創作和自主系統方面的潛在應用巨大，但摩根士丹利的報告對剩餘的技術挑戰進行了清醒的評估。一個主要障礙是隨時間累積的誤差；即使是像Google Genie 3這樣先進的模型，也只能在幾分鐘內保持穩定、連貫的模擬，之後物體和物理定律就會開始偏離。

其他主要障礙包括對生成環境缺乏精確控制、難以模擬具有多個代理的複雜社會動態，以及缺乏衡量進展的標準化基準。這些限制表明，世界模型最初可能會擴散到對錯誤容忍度較高的行業，例如數字內容和遊戲。滲透到需要嚴格物理準確性的領域，如機器人與自動駕駛汽車，將取決於解決這些基本工程問題。