JD.com, AI 데이터 수집을 위해 최대 60만 명 동원
3월 16일, 중국 전자상거래 대기업 JD.com은 체화 지능을 위한 세계 최대 데이터 수집 센터를 구축하고, 로봇 산업을 마비시키는 "데이터 기근"을 해결하기 위한 대규모 캠페인을 시작할 계획을 발표했습니다. 이 이니셔티브는 10만 명 이상의 자체 직원과 쑤첸 시에서만 10만 명의 시민을 포함하여 최대 50만 명의 외부 인력을 동원할 예정입니다. 목표는 2년 이내에 천만 시간 이상의 실제 물리적 상호작용 데이터를 축적하여 정교한 로봇이 복잡한 작업을 수행하도록 훈련하는 데 필요한 원료를 제공하는 것입니다. 이러한 "인해전술"은 고품질 훈련 데이터가 이제 모델 아키텍처나 원시 컴퓨팅 능력보다 더 중요해진 AI 로봇 공학의 주요 병목 현상을 해결하기 위한 강력한 시도를 나타냅니다.
이 프로젝트는 중국, 특히 베이징 이좡 경제기술개발구의 산업적 야망과 깊이 통합되어 있습니다. 300개 이상의 로봇 회사와 100억 위안 규모의 산업이 자리한 이 지역은 하드웨어와 테스트 환경을 제공합니다. JD의 이니셔티브는 자체 실제 물류, 산업 및 소매 시나리오에서 대규모 데이터 세트를 생성하여 "두뇌"를 제공함으로써 데이터 수집부터 하드웨어 반복까지의 폐쇄 루프 시스템을 구축하는 것을 목표로 합니다.
물류 네트워크로 로봇 공학의 고비용 데이터 문제 해결
JD.com의 전략은 핵심 사업을 AI 군비 경쟁에서 경쟁 우위로 활용합니다. 순수 소프트웨어 회사나 로봇 스타트업과 달리, JD의 광대한 물리적 공급망은 복잡한 실제 상호작용의 방대하고 지속적인 원천을 제공합니다. 이 접근 방식은 로봇 데이터 획득의 두 가지 주요 장애물인 "Sim-to-Real" 격차와 엄청난 비용을 직접적으로 해결합니다. 많은 스타트업이 가상 시뮬레이션에 의존하지만, 이러한 모델은 마찰이나 유연한 재료의 변형과 같은 미묘한 물리학을 완벽하게 재현할 수 없기 때문에 실제 세계로 이전하는 데 종종 실패합니다.
대안으로, 인간의 행동을 기록하기 위해 로봇을 원격으로 조작하는 것은 효과적이지만 경제적으로 확장할 수 없습니다. 업계 추정에 따르면, 단일 고품질의 복잡한 상호작용 작업을 캡처하고 정리하는 데 드는 비용은 수백 달러에 달합니다. JD는 택배원 및 창고 작업자의 일상 업무에 데이터 수집을 통합함으로써 이러한 병목 현상을 우회하는 것을 목표로 합니다. 이 모델은 테슬라가 기가팩토리를 사용하여 옵티머스 로봇을 훈련하는 방식과 유사하며, 회사의 기존 운영 인프라를 독점적인 데이터 생산 라인으로 전환하여 이러한 물리적 세계 접근 방식이 부족한 경쟁업체에게 상당한 진입 장벽을 만듭니다.
전문가들, 천만 시간이 품질 병목 현상을 해결할 수 있는지 의문 제기
이 프로젝트의 엄청난 규모에도 불구하고, 업계 전문가들은 양이 돌파구에 필요한 품질로 이어질 수 있는지 신중하게 검토하고 있습니다. 로봇 공학의 핵심 과제는 비디오 부족이 아니라 힘, 토크, 촉각 데이터와 같은 정밀한 물리적 피드백을 포함하는 "상태-액션 쌍"의 부족입니다. 택배원이 소포를 전달하는 것을 단순히 기록하는 것은 로봇의 세계 모델에 시각적 데이터를 제공하지만, 객체를 부수지 않고 얼마나 단단히 잡아야 하는지와 같은 제어 정책을 훈련하는 데는 거의 쓸모가 없습니다.
JD.com은 이러한 과제를 인지하고 있는 것으로 보이며, 첫 해에 "백만 시간의 로봇 본체 데이터"를 수집할 계획이라고 명시했습니다. 이는 일반적인 이해를 위한 광범위한 인간 중심 비디오와 작업을 수행하는 로봇의 보다 구체적인 고정밀 데이터를 결합하는 하이브리브 접근 방식을 시사합니다. 그러나 보편적인 데이터 표준의 부족을 포함하여 근본적인 문제는 여전히 남아 있습니다. 한 유형의 로봇을 위해 수집된 데이터는 다른 하드웨어 구성으로 인해 다른 로봇과 호환되지 않는 경우가 많습니다. JD가 업계를 중자산 경쟁의 새로운 단계로 이끌면서, 그 성공은 데이터 볼륨 문제뿐만 아니라 데이터 품질, 표준화 및 규정 준수라는 훨씬 더 어려운 과제를 해결하는 데 달려 있을 것입니다.