AI 데이터 기근, 인간 활동으로 170억 달러 시장 창출
임박한 AI "데이터 기근"에 직면하여 기술 기업들은 이제 개인에게 일상생활 기록에 대해 비용을 지불하고 있으며, 이는 새롭고 논란의 여지가 있는 시장을 창출하고 있습니다. 연구 회사인 에포크 AI(Epoch AI)는 기업들이 2026년까지 새로운 텍스트 기반 훈련 데이터를 소진할 것으로 예측하고 있으며, 이에 따라 기업들은 인간이 생성한 콘텐츠를 중요한 자원으로 활용하고 있습니다. 이는 2시간짜리 설거지 비디오가 작업자에게 80달러를 벌어주고, 1분 통화 녹음이 0.50달러의 가치를 가지며, 짧은 걷기 비디오가 14달러를 버는 긱 경제를 창출했습니다. 이 새로운 '데이터-현금' 경제는 호황을 누리고 있으며, CB Insights는 글로벌 데이터 수집 및 라벨링 시장이 2030년까지 170억 달러에 이를 것으로 예측합니다.
긱 경제 거대 기업 우버 및 도어대시, 근로자들을 데이터 수집으로 전환
AI 데이터 골드 러시는 이제 주요 긱 경제 플랫폼들을 끌어들이고 있으며, 이들 플랫폼은 방대한 독립 계약자 네트워크를 강력한 데이터 수집 군대로 보고 있습니다. 도어대시(DoorDash)는 최근 "태스크(Tasks)"라는 독립형 앱을 출시하여 8백만 명의 미국 배달원들이 가사일과 대화를 녹음하여 추가 수입을 올릴 수 있도록 했습니다. 이는 작년에 우버(Uber)가 시작한 유사한 파일럿 프로그램에 이은 것입니다. 전략적 인센티브는 명확합니다. 우버는 2025년에만 인간 운전자에게 854억 달러를 지출했습니다. 이러한 기업들은 인력으로부터 실제 데이터를 수집함으로써, 언젠가 인간 노동에 대한 의존도를 줄일 수 있는 자동화 및 로봇 기술을 훈련하는 데 필요한 데이터 세트를 구축하고 있습니다.
참여자들은 취소 불가능한 계약 하에 사생활을 현금과 교환
선불 현금이 매력적일 수 있지만, 참여자들은 종종 심각하게 문제가 있는 조건 하에 자신들의 사생활을 포기하고 있습니다. 네온 모바일(Neon Mobile) 및 클레드 AI(Kled AI)와 같은 플랫폼의 계약은 일반적으로 사용자에게 음성 및 초상권을 포함한 데이터에 대해 "전 세계적, 영구적, 취소 불가능하며 로열티 없는" 라이선스를 부여하도록 요구합니다. 이는 기업이 추가 보상 없이 개인 데이터를 판매, 수정 및 파생 작업을 생성할 권리를 갖는다는 것을 의미합니다. 위험은 이론적이지 않습니다. 2025년 9월 TechCrunch 보고서는 네온 모바일의 보안 취약점으로 인해 사용자 전화 번호와 통화 녹음이 노출된 사실을 밝혀냈습니다. 법률 전문가들은 데이터가 판매된 후에는 근로자들이 재협상하거나 동의를 철회할 법적 구제책이 거의 없다고 경고합니다.
많은 플랫폼 계약은 이러한 자료를 영구적으로, 그리고 더 이상 비용을 지불하지 않고 거의 모든 것을 할 수 있도록 허용합니다.
— 엔리코 보나디오, 런티 시티 대학교 법학 교수