JD.com, Yapay Zeka Veri Toplama İçin 600.000 Kişiye Kadar İnsan Harekete Geçiriyor
16 Mart'ta Çinli e-ticaret devi JD.com, bedenlenmiş zeka için dünyanın en büyük veri toplama merkezini kurma planlarını duyurdu ve robot endüstrisini felç eden "veri kıtlığını" ele almak için büyük bir kampanya başlattı. Girişim, 100.000'den fazla kendi çalışanını ve yalnızca Suqian şehrinde 100.000 vatandaş dahil olmak üzere 500.000'e kadar harici personeli harekete geçirmeyi amaçlıyor. Amaç, iki yıl içinde 10 milyon saatin üzerinde gerçek dünya fiziksel etkileşim verisi biriktirerek, karmaşık görevler için sofistike robotları eğitmek için gereken ham maddeyi sağlamaktır. Bu "insan denizi" taktiği, yüksek kaliteli eğitim verisinin artık model mimarisinden veya ham bilgi işlem gücünden daha kritik hale geldiği Yapay Zeka robotları için birincil darboğazı çözmek için kaba kuvvet bir girişimi temsil ediyor.
Proje, Çin'in endüstriyel hedefleriyle, özellikle de Pekin'deki Yizhuang Ekonomik ve Teknik Geliştirme Bölgesi ile derinlemesine entegredir. 300'den fazla robot şirketine ve 10 milyar yuanlık bir endüstriye ev sahipliği yapan bölge, donanım ve test alanları sağlıyor. JD'nin girişimi, kendi gerçek dünya lojistik, endüstriyel ve perakende senaryolarından büyük veri kümeleri oluşturarak "beyin"i sağlamayı ve veri toplamadan donanım yinelemesine kadar kapalı döngü bir sistem oluşturmayı amaçlıyor.
Lojistik Ağı, Robotik Yüksek Maliyetli Veri Sorununu Çözüyor
JD.com'un stratejisi, Yapay Zeka silahlanma yarışında temel işini rekabet avantajı olarak kullanıyor. Saf yazılım şirketlerinin veya robotik girişimlerinin aksine, JD'nin genişleyen fiziksel tedarik zinciri, karmaşık gerçek dünya etkileşimlerinin geniş ve sürekli bir kaynağını sunuyor. Bu yaklaşım, robotik veri toplamadaki iki ana engeli doğrudan ele alıyor: "Sim-to-Real" boşluğu ve fahiş maliyetler. Birçok girişim sanal simülasyonlara güvenirken, bu modeller sürtünme veya esnek malzemelerin deformasyonu gibi nüanslı fiziği mükemmel bir şekilde kopyalayamadıkları için genellikle gerçek dünyaya aktarılamaz.
Alternatif olarak, insan eylemlerini kaydetmek için robotları uzaktan çalıştırmak etkili ancak ekonomik olarak ölçeklenebilir değildir. Endüstri tahminleri, tek bir yüksek kaliteli, karmaşık etkileşim görevinin yakalanması ve temizlenmesinin maliyetini birkaç yüz dolar olarak belirtiyor. JD, veri toplamayı kuryeleri ve depo çalışanlarının günlük operasyonlarına entegre ederek bu darboğazı aşmayı amaçlıyor. Tesla'nın Optimus robotlarını eğitmek için Gigafactories'ini kullanmasına benzer bu model, bir şirketin mevcut operasyonel altyapısını özel bir veri üretim hattına dönüştürerek, bu tür fiziksel dünya erişimine sahip olmayan rakipler için önemli bir giriş engeli oluşturuyor.
Uzmanlar 10 Milyon Saatin Kalite Darboğazını Çözebileceğini Sorguluyor
Projenin büyük ölçeğine rağmen, endüstri uzmanları miktarın bir atılım için gereken kaliteye dönüşüp dönüşmeyeceğini dikkatle inceliyor. Robotikteki temel sorun, video eksikliği değil, kuvvet, tork ve dokunsal veri gibi kesin fiziksel geri bildirimleri içeren "durum-eylem çiftlerinin" kıtlığıdır. Bir kuryenin bir paketi teslim ettiğini kaydetmek, bir robotun dünya modeli için görsel veri sağlarken, kontrol politikasını – bir nesneyi ezmeden ne kadar sıkı tutulacağını – eğitmek için neredeyse işe yaramaz.
JD.com bu zorluğun farkında gibi görünüyor ve planının ilk yıl "1 milyon saat robot gövde verisi" toplamayı içerdiğini belirtiyor. Bu, genel anlama için geniş insan merkezli videoyu, görevleri yerine getiren robotlardan daha hedefe yönelik, yüksek kaliteli verilerle birleştiren hibrit bir yaklaşım öneriyor. Ancak, evrensel bir veri standardının olmaması da dahil olmak üzere temel sorunlar devam ediyor. Bir tür robot için toplanan veriler, farklı donanım yapılandırmaları nedeniyle genellikle diğeriyle uyumlu değildir. JD, sektörü ağır varlık rekabetinin yeni bir aşamasına iterken, başarısı sadece veri hacmi sorununu değil, veri kalitesi, standardizasyon ve uyumluluk gibi çok daha zorlu sorunları çözmeye bağlı olacaktır.