JD.com、AIデータ収集のために最大60万人を動員
3月16日、中国のEコマース大手JD.comは、具現化された知能のための世界最大のデータ収集センターを構築する計画を発表し、ロボット産業を麻痺させている「データ飢饉」に対処するための大規模なキャンペーンを開始しました。このイニシアチブは、自社の従業員10万人以上と、宿遷市だけで10万人の市民を含む最大50万人の外部人員を動員することを目的としています。目標は、2年以内に1,000万時間以上の現実世界での物理的相互作用データを蓄積し、複雑なタスクを実行するための高度なロボットを訓練するのに必要な生データを提供することです。この「人海戦術」は、高品質な訓練データがモデルアーキテクチャや生の計算能力よりも重要になっているAIロボット工学の主要なボトルネックを解決するための力ずくの試みを表しています。
このプロジェクトは、中国、特に北京の亦庄経済技術開発区の産業的野心と深く統合されています。この地域には300社以上のロボット企業と100億元規模の産業があり、ハードウェアと試験場を提供しています。JDのイニシアチブは、自社の現実世界での物流、産業、小売シナリオから大量のデータセットを生成することで「脳」を提供し、データ収集からハードウェアの反復までの一連の閉ループシステムを構築することを目指しています。
物流ネットワークがロボットの高コストデータ問題を解決
JD.comの戦略は、AI軍拡競争における競争優位性として、そのコアビジネスを活用しています。純粋なソフトウェア企業やロボットスタートアップとは異なり、JDの広大な物理的サプライチェーンは、複雑な現実世界での相互作用の膨大かつ継続的な情報源を提供します。このアプローチは、ロボットのデータ取得における2つの主要な障壁、すなわち「Sim-to-Real」ギャップと法外なコストに直接対処します。多くのスタートアップは仮想シミュレーションに依存していますが、これらのモデルは摩擦や柔軟な材料の変形といった微妙な物理現象を完全に再現できないため、現実世界への転送に失敗することがよくあります。
代替案である、人間のアクションを記録するためにロボットを遠隔操作する方法は効果的ですが、経済的に拡張可能ではありません。業界の推定によると、単一の高品質で複雑な相互作用タスクを捕捉しクリーンアップするコストは数百ドルに上ります。JDは、データ収集を宅配業者や倉庫作業員の日常業務に統合することで、このボトルネックを回避することを目指しています。テスラがギガファクトリーを使用してOptimusロボットを訓練する方法と同様に、このモデルは企業の既存の運用インフラを独自のデータ生産ラインに変え、物理世界へのアクセスを持たない競合他社にとって大きな参入障壁を生み出します。
専門家は1,000万時間が品質のボトルネックを解決できるか疑問視
プロジェクトの壮大な規模にもかかわらず、業界の専門家は、量がブレークスルーに必要な品質に変換できるかどうかを慎重に精査しています。ロボット工学における核となる課題は、ビデオの不足ではなく、力、トルク、触覚データなどの正確な物理的フィードバックを含む「状態-行動ペア」の不足です。宅配業者が荷物を配達するのを単に記録するだけでは、ロボットの世界モデルには視覚データを提供しますが、その制御ポリシー(物体を壊さずにどれくらいの力で掴むかなど)を訓練するにはほとんど役に立ちません。
JD.comはこの課題を認識しているようで、最初の1年で「100万時間のロボットボディデータ」を収集する計画を明記しています。これは、一般的な理解のための広範な人間中心のビデオと、タスクを実行するロボットからのよりターゲットを絞った高忠実度データを組み合わせたハイブリッドアプローチを示唆しています。しかし、普遍的なデータ標準の欠如を含む根本的な問題は依然として残っています。ある種類のロボットのために収集されたデータは、異なるハードウェア構成のために別の種類のロボットと互換性がないことがよくあります。JDがこの業界を重資産競争の新たな段階へと推し進めるにつれて、その成功は、データ量問題だけでなく、データ品質、標準化、コンプライアンスといったはるかに困難な課題を解決することにかかっています。