Công ty khởi nghiệp AI Anthropic hôm thứ Ba đã khởi động Project Glasswing, một liên minh với 12 gã khổng lồ tài chính và công nghệ, để triển khai mô hình Claude Mythos Preview chưa được công bố nhằm tìm kiếm và vá các lỗ hổng phần mềm quan trọng. Sáng kiến này quy tụ các đối thủ cạnh tranh như Google và Microsoft cùng với các công ty an ninh mạng kỳ cựu như CrowdStrike và Palo Alto Networks để đón đầu các mối đe dọa do AI cung cấp.
"Với tốc độ tiến bộ của AI, sẽ không lâu nữa những khả năng như vậy sẽ phổ biến... Hệ lụy — đối với nền kinh tế, an toàn công cộng và an ninh quốc gia — có thể rất nghiêm trọng," Newton Cheng, Trưởng nhóm Frontier Red Team Cyber tại Anthropic, cho biết trong một cuộc phỏng vấn.
Theo thông cáo của công ty, mô hình này đã xác định được hàng nghìn lỗi, bao gồm một lỗ hổng 27 năm tuổi trong hệ điều hành OpenBSD vốn được bảo mật nghiêm ngặt và một lỗi 16 năm tuổi trong thư viện video FFmpeg. Trên điểm chuẩn đánh giá CyberGym, Mythos Preview đạt 83,1%, vượt xa mức 66,6% từ mô hình tốt thứ hai của Anthropic là Claude Opus 4.6.
Dự án nhằm mục đích mang lại cho những người phòng thủ một khởi đầu thuận lợi khi doanh thu hàng năm của Anthropic vượt 30 tỷ USD giữa những báo cáo về đợt IPO tiềm năng vào tháng 10 năm 2026. Đối với các đối tác như Palo Alto Networks và CrowdStrike, sáng kiến này đại diện cho một thử nghiệm quan trọng về khả năng phòng thủ của AI trước các cuộc tấn công do AI thúc đẩy đang định hình lại lĩnh vực an ninh mạng, vốn đã khiến cổ phiếu của cả hai công ty giảm vào tháng trước khi có tin tức về sức mạnh của mô hình.
Một mô hình quá nguy hiểm để phát hành công khai
Anthropic cho biết họ sẽ không cung cấp rộng rãi Claude Mythos Preview do khả năng an ninh mạng tiên tiến của nó. Các thử nghiệm nội bộ của công ty cho thấy mô hình có thể tự động tìm và chuỗi nhiều lỗ hổng trong nhân Linux để leo thang từ quyền truy cập của người dùng bình thường lên toàn quyền kiểm soát máy. Hiệu suất của nó trên các điểm chuẩn mã hóa làm nổi bật khoảng cách về khả năng, đạt 93,9% trên SWE-bench Verified, so với 80,8% của Opus 4.6.
Công ty đang cam kết lên tới 100 triệu USD tín dụng sử dụng cho các đối tác và quyên góp 4 triệu USD cho các tổ chức bảo mật nguồn mở, bao gồm Linux Foundation và Apache Software Foundation, để quản lý quy trình tiết lộ. "Trong quá khứ, chuyên môn bảo mật là một thứ xa xỉ," Jim Zemlin, Giám đốc điều hành của Linux Foundation, cho biết. "Project Glasswing cung cấp một con đường đáng tin cậy để thay đổi phương trình đó."
Một canh bạc về tính minh bạch giữa những lỗ hổng bảo mật
Thông báo này được đưa ra sau một số sự cố bảo mật đáng xấu hổ của Anthropic, bao gồm lỗi cấu hình sai CMS vào tháng 3 làm lộ các tài liệu nội bộ và lỗi đóng gói làm rò rỉ ngắn gọn mã nguồn cho công cụ Claude Code của mình. Mặc dù công ty tuyên bố đây là lỗi con người trong các công cụ xuất bản chứ không phải là hành vi vi phạm kiến trúc bảo mật cốt lõi, nhưng các sự cố này làm dấy lên câu hỏi về sự tin tưởng khi họ yêu cầu các đối tác dựa vào mô hình mạnh mẽ nhất của mình.
Anthropic lập luận rằng dự án là một canh bạc cần thiết. Công ty tin rằng khả năng của các mô hình như Mythos Preview sẽ trở nên phổ biến trong vòng vài tháng, chứ không phải vài năm, và động thái có trách nhiệm duy nhất là trang bị vũ khí cho những người phòng thủ trước. Đó là một canh bạc rằng việc cung cấp quyền truy cập hạn chế cho các đối tác ngay bây giờ có thể xây dựng một hệ thống phòng thủ mạnh mẽ hơn trước khi các công cụ tấn công tương tự rơi vào tay những kẻ kém cẩn trọng hơn.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.