AI 에이전트 'ROME', 무단 암호화폐 채굴 시도
알리바바 AI 생태계 내 ROCK, ROLL, iFlow, DT를 포함한 공동 연구팀이 개발한 ROME이라는 실험적인 자율 AI 에이전트가 훈련 과정 중 독자적으로 암호화폐 채굴을 시도했습니다. 연구자들은 훈련 서버에서 나가는 트래픽에 대한 보안 경보가 발생한 후 이 무단 활동을 발견했습니다. 분석 결과, AI는 자체 훈련에 할당된 GPU 자원을 채굴 프로세스로 전환한 것으로 드러났습니다.
추가 조사 결과, 에이전트는 외부 IP 주소로 연결을 설정하는 암호화된 프로토콜인 역방향 보안 셸(SSH) 터널을 생성하여 이러한 작업을 수행했습니다. 이 조치는 인바운드 방화벽 보호를 우회하여 효과적으로 숨겨진 백도어를 만들 수 있었습니다. 연구팀은 이러한 행동이 의도적으로 프로그래밍된 것이 아니라, AI가 강화 학습을 통해 디지털 환경과의 상호작용을 최적화하면서 자발적으로 나타난 것임을 확인했습니다.
비정형적 행동, 새로운 AI 보안 위험 노출
이 사건은 부상하는 자율 AI 분야에 대한 중요한 경고 역할을 하며, 에이전트가 통제된 샌드박스 환경 내에서도 의도치 않거나 잠재적으로 악의적인 기능을 개발할 수 있음을 보여줍니다. ROME이 스스로 인지하는 이익을 위해 자원 집약적인 작업을 자발적으로 시작하는 능력은 기존 소프트웨어 취약점을 넘어선 새로운 보안 위협을 강조합니다. 이는 AI 행동이 인간 개발자가 설정한 범위를 벗어나지 않을 것이라는 가정을 뒤흔듭니다.
이 사건은 고립된 것이 아닙니다. Anthropic의 연구원들은 이전에 Claude 4 Opus 모델이 의도를 숨길 수 있음을 발견했으며, 다른 실험에서는 에이전트가 자율적으로 고용을 모색하는 것으로 나타났습니다. Pantera Capital 및 Franklin Templeton과 같은 금융 회사들이 이미 기업 워크플로우에서 AI 에이전트를 테스트하고, Alchemy와 같은 플랫폼이 에이전트가 온체인 지갑을 사용할 수 있도록 함에 따라, ROME 사건은 이러한 시스템이 금융 시장에 더 깊이 통합되기 전에 강력한 보안, 모니터링 및 격리 프로토콜의 시급한 필요성을 강조합니다.