Anthropic đang hạn chế mô hình AI mạnh mẽ nhất của mình, Mythos, bằng cách sử dụng nó với hơn 40 đối tác bao gồm Google và Microsoft để săn tìm các lỗi phần mềm trước khi kẻ thù có thể khai thác chúng.
Quay lại
Anthropic đang hạn chế mô hình AI mạnh mẽ nhất của mình, Mythos, bằng cách sử dụng nó với hơn 40 đối tác bao gồm Google và Microsoft để săn tìm các lỗi phần mềm trước khi kẻ thù có thể khai thác chúng.

Anthropic đã khởi động một sáng kiến an ninh mạng sâu rộng để triển khai mô hình AI tiên tiến chưa công bố của mình, Claude Mythos Preview, chống lại các phần mềm quan trọng, tìm thấy hàng nghìn lỗ hổng bao gồm một lỗi 27 năm tuổi trong một trong những hệ điều hành bảo mật nhất thế giới. Nỗ lực này, mang tên Project Glasswing, là một nỗ lực nhằm mang lại lợi thế cho những người phòng thủ trước khi các công cụ hack do AI thúc đẩy mạnh mẽ như vậy trở nên phổ biến, nhưng nó cũng đặt các thực hành bảo mật của chính Anthropic dưới sự giám sát chặt chẽ.
"Với tốc độ tiến bộ của AI, sẽ không lâu nữa những khả năng như vậy sẽ phổ biến, có thể vượt ra ngoài những tác nhân cam kết triển khai chúng một cách an toàn," Newton Cheng, Trưởng nhóm An ninh mạng Red Team Frontier tại Anthropic, nói với VentureBeat. "Hậu quả — đối với nền kinh tế, an toàn công cộng và an ninh quốc gia — có thể rất nghiêm trọng."
Công ty đang hạn chế mô hình này khỏi việc phát hành công khai, thay vào đó cung cấp quyền truy cập cho một tập đoàn gồm hơn 40 tổ chức bao gồm Amazon, Apple, Google, Microsoft và The Linux Foundation. Trong các thử nghiệm ban đầu, Anthropic khẳng định Mythos đã xác định được một lỗ hổng từ xa 27 năm tuổi trong OpenBSD và một lỗi 16 năm tuổi trong thư viện video FFmpeg. Trên tiêu chuẩn đánh giá CyberGym, Mythos Preview đạt 83,1%, một bước nhảy vọt đáng kể so với mức 66,6% của Claude Opus 4.6, mô hình tốt thứ hai của hãng.
sáng kiến này nhằm thay đổi kinh tế học của an ninh mạng, đe dọa khả năng tồn tại của việc săn lỗi thủ công và buộc phải chuyển sang xây dựng bảo mật trực tiếp vào chu kỳ phát triển phần mềm. Dự án, được hỗ trợ bởi cam kết 100 triệu USD dưới dạng tín dụng sử dụng mô hình từ Anthropic, có thể giúp các đối tác tiết kiệm hàng tỷ USD chi phí vi phạm tiềm năng, một con số tương ứng với tốc độ doanh thu hàng năm được báo cáo của Anthropic là hơn 30 tỷ USD.
Khối lượng lỗ hổng khổng lồ do Mythos phát hiện đặt ra một thách thức về hậu cần. Anthropic cho biết họ đã phát triển một quy trình phân loại để xác minh thủ công các lỗi có mức độ nghiêm trọng cao trước khi báo cáo cho những người duy trì, nhằm tránh làm quá tải các nhà phát triển mã nguồn mở không được trả lương. Công ty cũng đang quyên góp 4 triệu USD cho các tổ chức như OpenSSF và Apache Software Foundation để hỗ trợ những nỗ lực này.
"Trong quá khứ, chuyên môn bảo mật là một thứ xa xỉ dành riêng cho các tổ chức có đội ngũ bảo mật lớn," Jim Zemlin, Giám đốc điều hành của Linux Foundation, cho biết trong một tuyên bố. "Project Glasswing cung cấp một con đường đáng tin cậy để thay đổi phương trình đó."
Việc phát hành có kiểm soát này diễn ra khi Anthropic đối mặt với những câu hỏi về an ninh vận hành của chính mình. Sự tồn tại của Mythos lần đầu tiên được tiết lộ sau khi một bản nháp bài đăng trên blog bị bỏ lại trong một kho lưu trữ dữ liệu công cộng không được bảo mật. Vài ngày sau, công ty đã vô tình xuất bản mã nguồn cho gói Claude Code của mình trên npm. Mặc dù Anthropic tuyên bố đây là những lỗi do con người trong các công cụ xuất bản chứ không phải là sự vi phạm kiến trúc bảo mật cốt lõi, nhưng các sự cố này dấy lên câu hỏi về vai trò của họ như người giám hộ cho một AI mà họ cho là quá nguy hiểm để phát hành công khai.
Câu hỏi trọng tâm là lợi thế dẫn đầu của Anthropic sẽ kéo dài bao lâu. Các giám đốc điều hành công ty ước tính rằng các đối thủ có thể phát triển các khả năng tương tự trong vòng vài tháng, chứ không phải vài năm. Do đó, sáng kiến này là một cuộc đua để vá các hệ thống quan trọng trước khi các công cụ tấn công phổ biến. Đối với các đối tác như Microsoft và CrowdStrike, mô hình này đã được sử dụng để củng cố cơ sở mã của chính họ.
Động thái này ảnh hưởng đến toàn bộ ngành bảo mật, đặc biệt là các công ty chuyên quản lý lỗ hổng và kiểm tra thâm nhập. Nếu AI có thể tự động hóa việc phát hiện ở quy mô lớn với giá 125 USD cho mỗi triệu token đầu ra, mô hình kinh doanh cho các cuộc kiểm toán bảo mật do con người dẫn dắt sẽ đối mặt với áp lực đáng kể. Đối với các nhà đầu tư, dự án làm nổi bật bản chất sử dụng kép của AI tiên tiến, nơi rủi ro và cơ hội lớn nhất là hai mặt của cùng một đồng xu. Thị trường vẫn chưa định giá được các tác động phòng thủ và tấn công của AI có thể tự trị tìm và khai thác các lỗ hổng phần mềm quan trọng.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.