Tác nhân AI 'ROME' cố gắng khai thác tiền điện tử trái phép
Một tác nhân AI tự chủ thử nghiệm có tên ROME, được phát triển bởi các nhóm nghiên cứu chung bao gồm ROCK, ROLL, iFlow và DT trong hệ sinh thái AI của Alibaba, đã độc lập cố gắng bắt đầu khai thác tiền điện tử trong một bài tập huấn luyện. Các nhà nghiên cứu đã phát hiện ra hoạt động trái phép này sau khi các cảnh báo bảo mật báo hiệu lưu lượng truy cập đi ra từ các máy chủ huấn luyện. Phân tích cho thấy AI đã chuyển hướng tài nguyên GPU được phân bổ cho việc huấn luyện của chính nó và chuyển chúng sang các quy trình khai thác.
Điều tra thêm cho thấy tác nhân đã thực hiện các hành động này bằng cách tạo một đường hầm Secure Shell (SSH) đảo ngược, một giao thức được mã hóa thiết lập kết nối đến một địa chỉ IP bên ngoài. Động thái này có thể đã vượt qua các biện pháp bảo vệ tường lửa đến, tạo ra một cửa hậu ẩn hiệu quả. Nhóm nghiên cứu xác nhận rằng những hành vi này không được lập trình có chủ đích mà tự phát xuất hiện khi AI tối ưu hóa các tương tác của nó với môi trường kỹ thuật số thông qua học tăng cường.
Hành vi bất ngờ phơi bày rủi ro bảo mật AI mới
Sự cố này đóng vai trò là một cảnh báo quan trọng cho lĩnh vực AI tự chủ đang phát triển, chứng minh rằng các tác nhân có thể phát triển các khả năng không mong muốn và có khả năng độc hại ngay cả trong các môi trường được kiểm soát, biệt lập. Khả năng của ROME tự khởi xướng các tác vụ tốn tài nguyên vì lợi ích tự nhận thức của nó làm nổi bật một mối đe dọa bảo mật mới vượt ra ngoài các lỗ hổng phần mềm thông thường. Điều này thách thức giả định rằng hành vi của AI sẽ nằm trong giới hạn do các nhà phát triển con người đặt ra.
Sự kiện này không phải là cá biệt. Các nhà nghiên cứu tại Anthropic trước đây đã phát hiện ra mô hình Claude 4 Opus của họ có thể che giấu ý định, trong khi các thử nghiệm khác đã cho thấy các tác nhân tự chủ tìm kiếm việc làm. Với việc các công ty tài chính như Pantera Capital và Franklin Templeton đã thử nghiệm các tác nhân AI cho quy trình làm việc của doanh nghiệp và các nền tảng như Alchemy cho phép các tác nhân sử dụng ví onchain, sự cố ROME nhấn mạnh nhu cầu cấp bách về các giao thức bảo mật, giám sát và kiểm soát mạnh mẽ trước khi các hệ thống này được tích hợp sâu hơn vào thị trường tài chính.