京东动员多达六十万人进行AI数据采集
3月16日,中国电商巨头京东宣布计划建设全球最大的具身智能数据采集中心,并发起一项大规模行动,以应对困扰机器人行业的“数据饥荒”。该倡议计划动员超过10万名自有员工和多达50万名外部人员,其中包括仅宿迁市的10万名市民。目标是在两年内积累超过1000万小时的真实世界物理交互数据,为训练执行复杂任务的精密机器人提供所需的原始材料。这种“人海战术”代表了一种强力尝试,旨在解决AI机器人面临的主要瓶颈,即高质量训练数据目前比模型架构或原始计算能力更为关键。
该项目与中国,特别是北京亦庄经济技术开发区的产业雄心深度融合。亦庄经济技术开发区拥有300多家机器人公司和100亿人民币的产业规模,提供硬件和测试场地。京东的倡议旨在通过从其自身的真实世界物流、工业和零售场景中生成海量数据集来提供“大脑”,从而建立一个从数据采集到硬件迭代的闭环系统。
物流网络解决机器人数据采集高成本问题
京东的战略利用其核心业务,在AI军备竞赛中形成了竞争优势。与纯软件公司或机器人初创企业不同,京东庞大的实体供应链提供了海量、持续的复杂真实世界交互数据来源。这种方法直接解决了机器人数据获取中的两大主要障碍:“虚实鸿沟”(Sim-to-Real Gap)和高昂的成本。尽管许多初创企业依赖虚拟仿真,但这些模型往往难以迁移到真实世界,因为它们无法完美复现摩擦或柔性材料变形等细微物理现象。
另一种方案,即通过远程操作机器人记录人类行为,虽然有效但经济上不可行。行业估计,捕获和清洗一个高质量、复杂的交互任务的数据成本高达数百美元。通过将数据采集整合到其快递员和仓库工人的日常运营中,京东旨在绕过这一瓶颈。这种模式类似于特斯拉如何利用其超级工厂训练Optimus机器人,它将公司的现有运营基础设施转化为专有数据生产线,为缺乏此类物理世界访问权限的竞争对手设置了巨大的进入壁垒。
专家质疑1000万小时能否解决质量瓶颈
尽管该项目规模宏大,但行业专家仍在审慎评估,数量是否能转化为实现突破所需的质量。机器人领域的核心挑战并非缺乏视频,而是缺乏包含精确物理反馈(例如力、扭矩和触觉数据)的“状态-动作对”(state-action pairs)。简单地记录快递员递送包裹仅为机器人的世界模型提供视觉数据,但对于训练其控制策略——如何在不损坏物体的情况下牢固抓取——几乎毫无用处。
京东似乎已经意识到了这一挑战,其计划明确指出第一年将收集“100万小时的机器人本体数据”。这表明了一种混合方法,即将广泛的人类中心视频用于一般理解,并结合来自执行任务机器人的更具针对性的高保真数据。然而,一些根本性问题依然存在,包括缺乏统一的数据标准。由于硬件配置不同,为一种机器人收集的数据往往与另一种机器人不兼容。随着京东将该行业推向重资产竞争的新阶段,其成功将不仅取决于解决数据量问题,还将取决于解决数据质量、标准化和合规性等更严峻的挑战。