Việc Anthropic đảo ngược chính sách đối với mô hình Mythos mạnh mẽ của mình báo hiệu một kỷ nguyên mới của phòng thủ hợp tác, buộc một lĩnh vực an ninh mạng mỏng manh phải tính toán với các mối đe dọa do AI thúc đẩy vốn vượt xa các phản ứng do con người dẫn dắt.
Anthropic đã đảo ngược một chính sách quan trọng đối với mô hình Mythos AI mạnh mẽ của mình, hiện cho phép khoảng 50 công ty trong "Dự án Glasswing" độc quyền của mình chia sẻ thông tin tình báo về mối đe dọa với các thực thể bên ngoài. Động thái này, một sự thay đổi đáng kể so với các thỏa thuận bảo mật ban đầu, diễn ra sau áp lực từ các nhà lập pháp Hoa Kỳ lo ngại rằng việc ngăn chặn các lỗ hổng do AI phát hiện có thể gây nguy hiểm cho cơ sở hạ tầng quan trọng.
"Không có thực thể nào bị hạn chế về mặt hợp đồng trong việc cảnh báo người khác, điều phối các biện pháp giảm thiểu hoặc thông báo cho các bên liên quan có liên quan và đáng tin cậy về các rủi ro mạng khẩn cấp," Hạ nghị sĩ Josh Gottheimer (D., N.J.) đã viết trong một bức thư gửi cho Anthropic, theo tờ The Wall Street Journal. Gottheimer là đồng chủ tịch của một ủy ban Dân chủ tại Hạ viện về AI.
Chính sách ban đầu yêu cầu các công ty lớn và các nhà khai thác cơ sở hạ tầng quan trọng sử dụng Mythos phải giữ bí mật các phát hiện của nó. Tuần trước, Anthropic đã bắt đầu thông báo cho các đối tác này rằng giờ đây họ có thể chia sẻ thông tin một cách có trách nhiệm về các mối đe dọa mạng và các phát hiện của Mythos. Sự thay đổi này diễn ra khi các công ty như Palo Alto Networks và Mozilla bắt đầu công khai tính hiệu quả của mô hình, với việc Mozilla lưu ý rằng Mythos đã tìm thấy 271 lỗ hổng trong trình duyệt Firefox của mình chỉ trong một lần chạy.
Cuộc tranh luận về chính sách của Anthropic nhấn mạnh thách thức cốt lõi mà toàn bộ lĩnh vực công nghệ đang đối mặt: làm thế nào để quản lý việc triển khai các công cụ AI có thể vừa xây dựng vừa phá hủy các hệ thống kỹ thuật số ở quy mô chưa từng có. Khả năng của các mô hình như Mythos đang thúc đẩy những gì một số chuyên gia an ninh mạng gọi là "Bugmageddon", một làn sóng phát hiện lỗ hổng do AI thúc đẩy đe dọa áp đảo quy trình vá lỗi và bảo vệ mạng do con người dẫn dắt.
Công nghiệp hóa tấn công mạng
Giả định rằng việc khai thác các lỗi phần mềm phức tạp là một kỹ năng hiếm có đang sụp đổ. Theo một báo cáo gần đây của Google, toàn bộ chuỗi tấn công "đang ngày càng được xác định bởi phần mềm và được thực hiện nhanh hơn và rẻ hơn bao giờ hết." Xu hướng này không chỉ tạo ra nhiều vụ tấn công mạng hơn; nó còn dẫn đến sự công nghiệp hóa của tấn công mạng. CrowdStrike đã ghi nhận mức tăng 89% so với cùng kỳ năm ngoái trong các hoạt động của kẻ thù được hỗ trợ bởi AI vào năm 2025, một nhịp độ sẽ không thực tế nếu không có sự hỗ trợ của AI.
Tốc độ của sự thay đổi này là đáng kinh ngạc. Dự án Zero Day Clock, theo dõi thời gian từ khi phát hành bản vá đến khi xuất hiện một khai thác hoạt động, đã chứng kiến thời gian trung bình giảm từ 2,3 năm vào năm 2018 xuống còn chỉ 20 giờ vào năm 2026. Sự gia tốc này, được thúc đẩy bởi khả năng "patch-diff" và đảo ngược kỹ thuật các bản sửa lỗi của AI, khiến các tổ chức có một cửa sổ cực kỳ nhỏ để khắc phục các sai sót.
Vết nứt trong nền tảng
Theo một phân tích gần đây từ Hội đồng Quan hệ Đối ngoại, sự lan tỏa của AI đang kiểm tra mức độ chịu đựng của ba giả định cốt lõi đã làm nền tảng cho an ninh mạng trong 30 năm qua. Thứ nhất là các cuộc tấn công tinh vi rất tốn kém; AI đã làm cho chúng rẻ đi. Thứ hai là các hệ thống định danh được xây dựng cho con người có thể quản lý các tác nhân không phải con người; điều đó đang chứng minh là sai lầm, khi các tác nhân tự động bắt đầu hành động với những hậu quả không lường trước được.
Vết nứt cuối cùng và tinh vi nhất là việc loại bỏ sự phán đoán của con người như một chốt chặn. Nơi mà một nhà phân tích trước đây có thể đã dừng lại trước một sự bất thường, các tổ chức hiện đang tự động hóa các hoạt động xem xét và phê duyệt để hoạt động với tốc độ máy móc. Điều này loại bỏ một lớp phòng thủ quan trọng, dù không chính thức, chính vào lúc cần thiết nhất.
Quyết định của Anthropic cho phép chia sẻ mối đe dọa rộng rãi hơn là một sự thừa nhận ngầm về thực tế mới này. Đối với các nhà đầu tư, động thái này báo hiệu một sự thay đổi vĩnh viễn trong bối cảnh an ninh mạng. Thông báo ban đầu về khả năng của Mythos đã khiến cổ phiếu an ninh mạng sụt giảm, phản ánh nỗi lo ngại rằng AI sẽ biến công việc bảo mật thành hàng hóa thông thường. Thực tế phức tạp hơn: trong khi AI tự động hóa việc tấn công, nhu cầu về phòng thủ tinh vi được hỗ trợ bởi AI và các khung quản trị mạnh mẽ đang tạo ra một thị trường mới có rủi ro cao. Thay đổi chính sách có thể làm tăng chi phí tuân thủ cho các nhà lãnh đạo AI như Anthropic và OpenAI, nhưng nó cũng củng cố giá trị của toàn bộ lĩnh vực an ninh mạng, vốn giờ đây phải thích nghi với một thế giới mà cả kẻ tấn công và người phòng thủ đều hoạt động với tốc độ máy móc.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.