AI 的下一個淘金熱：具身智能繁榮中的三大數據「鏟子」

從基於語言的 AI 向物理交互式「世界模型」的範式轉變，正在為訓練這些模型所需的基礎數據基礎設施創造投資熱潮。根據國泰海通的一份最新報告，具身智能的主要瓶頸不再是算法，而是巨大的數據缺口，數據需求正膨脹至艾位元組（EB）量級。這使得數據採集、模擬和處理公司成為下一波人工智能浪潮中的核心「工具商」。

「率先填補這一數據缺口的公司將扮演物理 AI 時代的『鏟子銷售商』，並獲得顯著的估值溢價，」國泰海通在報告中指出。

具身智能對數據的需求比大語言模型高出幾個數量級。雖然大語言模型（LLM）是在拍位元組（PB）級的文本和圖像數據集上訓練的，但與現實世界交互的機器人需要艾位元組級的數據，其中包括物理交互信息——力量、觸覺和摩擦力。這種專業化、高品質的數據極其匱乏，構成了整個機器人行業的根本瓶頸。

這種稀缺性迫使人們重新評估機器人價值鏈。重點正在從機器人硬件本身轉向能夠解決數據採集和處理問題的數據基礎設施提供商。這一趨勢可能會引發大量資金流入專注於數據工具和服務的人工智能股票這一新子版塊，短期內其受益程度可能超過機器人製造商。

萬億美元的數據難題：三種競爭方案

為了彌補數據缺口，業界正在嘗試三種主要路徑，每種路徑都有其優缺點：

現實世界數據： 通過人類操作的遠程操作裝置和運動捕捉服採集，這種方法包含真實的物理交互，因此提供了最高保真度的數據。然而，其成本高昂，難以規模化，且無法覆蓋所有極端案例。1X Technologies 等公司優先考慮此路徑，認為這是跨越「仿真到現實（Sim2Real）」鴻溝的唯一方法。
合成與仿真數據： 使用物理引擎在虛擬環境中生成大規模、標記完美的訓練集。這種方法成本低且可擴展性強，如 Galaxy General 等公司目標是實現 99:1 的合成與真實數據比例。其主要弱點是「仿真到現實」的差距，即由於細微的物理差異，在仿真中訓練的模型在現實世界中往往表現欠佳。
視頻數據： 一種更新的方法，利用海量的互聯網視頻來教學模型。特斯拉（Tesla）和 Figure AI 等公司正轉向這種方法，認為視頻數據的巨大規模可以彌補其缺乏直接物理屬性的不足。挑戰在於如何將二維視頻「升維」到三維動作，這是一個複雜的技術難題。

目前的共識是，一種混合方法——使用仿真和視頻進行大規模預訓練，然後使用少量、高品質的現實世界數據進行微調——將成為行業標準。

機器人製造者和科技巨頭如何押注

這種戰略分歧在整個行業中隨處可見。特斯拉著名的 Optimus 機器人已放棄了遠程操作，轉而依賴其車隊的視頻數據。由 OpenAI 和微軟支持的 Figure AI 啟動了「Project Go-Big」，旨在通過零樣本學習將技能從人類視頻轉移到其機器人身上。

相反，中國的初創公司智元機器人（Zhiyuan Jīqìrén）據報導在其大模型訓練中使用了 100% 的現實世界數據。這突顯了各方在押注哪種數據源最終證明最為有效方面的策略博弈。

這一趨勢不僅限於機器人領域。印度金融科技巨頭 Paytm 儘管有宏大的 AI 願景，但並不打算建立自己的數據中心。相反，它將向 NVIDIA 等供應商租用計算能力，並在第三方基礎設施上運行其專有模型，正如首席執行官 Vijay Shekhar Sharma 在 FY26 第四季度財報會議上確認的那樣。這一戰略驗證了「鏟子商」論點：即使是主要的科技玩家也選擇成為核心基礎設施提供商的客戶，而非競爭對手。

「工具商」投資組合：資本流向何處

市場已經在獎勵這些「鏟子銷售商」。正如歐洲 AI 驅動的獨角獸潮以及中國月之暗面（Moonshot AI）完成 20 億美元巨額融資所表現的那樣，投資者正在向提供基礎能力的公司投入資本。根據國泰海通的報告，投資正集中在四個關鍵領域：

視頻數據轉換： 能夠以低成本將互聯網視頻轉換為可用訓練數據的平台。
仿真平台： 提供虛擬訓練場和合成數據生成器的公司。
硬件與傳感器： 光學慣性手套和電子皮膚等高保真數據採集工具的製造商。
集成數據服務： 建立結合所有三種數據源的綜合訓練設施和工程平台的公司。

對於投資者而言，這意味著具身智能領域最有前景的機會可能不是製造機器人的公司，而是那些銷售使機器人變得智能所需的必要數據和工具的公司。

本文僅供參考，不構成投資建議。