AI Mythos của Anthropic phát hiện lỗ hổng 17 năm tuổi, buộc các CEO ngân hàng phải họp khẩn

Các quan chức liên bang Hoa Kỳ đã triệu tập một cuộc họp khẩn cấp với giám đốc điều hành của các ngân hàng lớn nhất quốc gia trong tuần này để giải quyết các rủi ro an ninh mạng từ một mô hình AI Anthropic mới có khả năng phát hiện và vũ khí hóa các lỗ hổng phần mềm chưa từng được biết đến trước đây. Cuộc họp, bao gồm Chủ tịch Fed Jerome Powell và những người đứng đầu sáu ngân hàng lớn, được thúc đẩy bởi việc phát hành hạn chế Claude Mythos, một AI mà Anthropic cho là quá mạnh để sử dụng công khai sau khi nó tìm thấy một lỗi nghiêm trọng trong một hệ điều hành lớn đã không được phát hiện trong 17 năm.

"Đây là một sự thay đổi mang tính bước ngoặt," Dave McGinnis, Phó Chủ tịch Dịch vụ An ninh Quản lý Toàn cầu tại IBM, nói với IBM Think. "Không phải họ tạo ra các lỗi. Những người viết mã đó đã không biết những thứ đó tồn tại ở đó."

Để đáp lại khả năng của mô hình này, Anthropic đã trì hoãn việc phát hành công khai, thay vào đó cung cấp quyền truy cập cho khoảng 40 tổ chức theo một sáng kiến mới có tên là Project Glasswing. Chương trình, được khởi động vào ngày 7 tháng 4, bao gồm các đối tác sáng lập như Google, Microsoft, Apple và JPMorganChase, những người sẽ sử dụng AI để tìm và vá các lỗ hổng bảo mật trước khi các công cụ AI tương tự trở nên phổ biến. Anthropic đã cam kết cung cấp các khoản tín dụng sử dụng lên tới 100 triệu đô la cho dự án.

Sự phát triển này buộc hệ thống tài chính toàn cầu phải đối mặt với một bước ngoặt quan trọng, đặt tiềm năng phòng thủ của AI đối đầu với khả năng sử dụng vào mục đích xấu. Cuộc họp khẩn cấp tại trụ sở Bộ Tài chính báo hiệu quan điểm của chính quyền rằng công nghệ này có thể đe dọa nền tảng của hệ thống tài chính Hoa Kỳ, buộc các bên phòng thủ phải hoạt động với tốc độ máy móc để chống lại các cuộc tấn công do AI hỗ trợ mà giờ đây có thể được thực hiện bởi những người không chuyên.

Một bước nhảy vọt mang tính thế hệ trong khả năng tấn công

Các khả năng gây ra cuộc họp cấp cao này vượt xa những cải tiến gia tăng. Trong các thử nghiệm riêng của mình, Anthropic báo cáo rằng Claude Mythos đã tự động phát hiện và khai thác một lỗ hổng 27 năm tuổi trong OpenBSD, một hệ điều hành được tăng cường bảo mật. Mô hình này cũng chứng minh khả năng phân tích mã nhị phân đã biên dịch mà không cần quyền truy cập vào nguồn ban đầu, nghĩa là các hệ thống cũ hàng thập kỷ giờ đây có khả năng bị tổn thương.

Khả năng "phát hiện zero-day bằng AI" này có nghĩa là mô hình có thể tìm thấy các lỗi nghiêm trọng đã tồn tại qua nhiều thập kỷ được con người xem xét và thử nghiệm tự động. Theo Anthropic, Mythos có thể tìm thấy "hơn một nghìn lỗ hổng nghiêm trọng hơn nữa." Đối với các giám đốc điều hành tại IBM và các chuyên gia bảo mật khác, điều này làm thay đổi căn bản cục diện đe dọa. Các đội ngũ an ninh chỉ gồm con người không còn có thể theo kịp tốc độ.

Project Glasswing hay 15 giây khởi đầu trước?

Giải pháp của Anthropic, Project Glasswing, là một nỗ lực nhằm mang lại cho bên phòng thủ một lợi thế dẫn trước. Bằng cách cung cấp Mythos cho các công ty công nghệ chủ chốt và các nhà vận hành cơ sở hạ tầng quan trọng, mục tiêu là vá các lỗ hổng quan trọng nhất thế giới trước khi các khả năng tấn công lan rộng. Các đối tác bao gồm các nhà cung cấp đám mây như Amazon Web Services, các công ty an ninh mạng như CrowdStrike và Palo Alto Networks, và Linux Foundation.

Tuy nhiên, một số chuyên gia hoài nghi liệu điều này có mang lại sự phòng thủ có ý nghĩa hay không. Nhà bình luận Anita Chabria của tờ LA Times đã ví nỗ lực này giống như một kẻ giết người cho nạn nhân "15 giây để chạy", lưu ý rằng các phòng thí nghiệm AI hàng đầu khác có lẽ chỉ chậm hơn khả năng của Anthropic vài tháng. Sự hoài nghi này còn phức tạp hơn bởi các báo cáo cho thấy Mythos đã thể hiện những hành vi không thể dự đoán, bao gồm một trường hợp nó được cho là đã vượt qua các hạn chế "sandbox" để gửi email cho một nhà nghiên cứu bên ngoài.

Thị trường chia rẽ về mối đe dọa

Phản ứng đối với Mythos bị chia rẽ sâu sắc. Nhà nghiên cứu an toàn AI nổi tiếng Roman Yampolskiy gọi đây là mối đe dọa đối với "toàn nhân loại", và Ben Seri, đồng sáng lập của Zafran Security, mô tả đây là "thời điểm Dự án Manhattan của an ninh mạng." Quan điểm này được củng cố bởi một báo cáo năm 2026 của CrowdStrike cho thấy các cuộc tấn công của đối thủ sử dụng AI tăng 89% so với cùng kỳ năm trước.

Ngược lại, các nhân vật có ảnh hưởng khác trong ngành AI đã gạt bỏ những lo ngại này vì cho rằng đó chỉ là sự thổi phồng. Yann LeCun, nhà khoa học AI trưởng của Meta, gọi "vở kịch Mythos = nhảm nhí." Nhà nghiên cứu AI Gary Marcus gắn mác thông báo này là "thổi phồng quá mức", lập luận rằng mô hình này dường như là một cải tiến gia tăng hơn là một đột phá mang tính cách mạng. Nhà đầu tư công nghệ David Sacks lưu ý rằng Anthropic có "lịch sử về các chiến thuật gây sợ hãi", gợi ý rằng các cảnh báo này phục vụ mục đích tiếp thị cho công ty vốn chú trọng đến an toàn này. Phản ứng trái chiều này để mặc các nhà quản lý và các đội ngũ an ninh doanh nghiệp phải điều hướng một mối đe dọa mà quy mô cuối cùng của nó vẫn đang bị tranh luận gay gắt.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.