AI Mythos của Anthropic đạt giới hạn tác vụ 16 giờ, thúc đẩy cuộc chạy đua vũ trang an ninh mạng

Một điểm chuẩn AI mới cho thấy các mô hình hiện có thể xử lý các tác vụ mất 16 giờ, vượt qua ngưỡng quan trọng đối với công việc tự động và các ứng dụng an ninh mạng.

Một mô hình AI tiên tiến từ Anthropic đã chứng minh khả năng hoàn thành tự động các tác vụ kỹ thuật phần mềm phức tạp kéo dài tới 16 giờ, một ngưỡng khả năng mới đang định hình lại bối cảnh cho an ninh mạng dựa trên AI. Kết quả từ nhóm đánh giá AI METR cho thấy sự tăng trưởng siêu lũy thừa trong khả năng của mô hình, một xu hướng mà các nhà cung cấp an ninh mạng như Palo Alto Networks Inc. báo cáo là đang có tác động mạnh mẽ đến cả các hoạt động tấn công và phòng thủ.

"Sử dụng [AI tiên tiến] để hỗ trợ phân tích lỗ hổng, chỉ trong 3 tuần, chiều sâu và chiều rộng của công việc đã hoàn thành tương đương với khối lượng công việc của cả một nhóm thử nghiệm xâm nhập cấp cao trong cả một năm," Palo Alto Networks đã viết trong một báo cáo gần đây về tác động của công nghệ.

Điểm chuẩn mới cho thấy mô hình Claude Mythos của Anthropic có thể đạt tỷ lệ thành công 50% trong các tác vụ yêu cầu 16 giờ làm việc của con người. Bước nhảy vọt về khả năng này đang buộc thế giới phần mềm phải tính toán lại nhanh chóng về rủi ro và năng suất. Palo Alto Networks, đơn vị được cấp quyền truy cập sớm vào mô hình, nhận thấy nó có thể nén quá trình tìm kiếm và liên kết nhiều lỗ hổng rủi ro thấp thành một chuỗi tấn công chết người chỉ trong 25 phút.

Sự phát triển này thúc đẩy một cuộc chạy đua vũ trang AI giữa các công ty an ninh mạng, gây áp lực lên những cái tên đương nhiệm như Palo Alto Networks (PANW), Fortinet (FTNT) và Zscaler Inc. Nó cũng làm tăng cường sự cạnh tranh nền tảng giữa các nhà phát triển AI như Anthropic và đối thủ OpenAI. Đối với các nhà đầu tư, câu hỏi then chốt là mức độ tự chủ AI mới này chuyển đổi như thế nào thành các sản phẩm doanh nghiệp đáng tin cậy và các dòng doanh thu có thể bảo vệ được.

Một chuẩn mực mới cho quyền tự chủ của AI

Biểu đồ "chân trời thời gian" của METR đo lường độ dài của các tác vụ phát triển phần mềm mà các mô hình tiên tiến có thể hoàn thành. Kết quả mới nhất cho thấy Mythos xử lý thành công các tác vụ 16 giờ trong một nửa thời gian, một bước nhảy vọt đáng kể so với các tác vụ kéo dài vài phút hoặc một giờ mà các mô hình có thể xử lý trong những năm trước. Đơn vị đánh giá lưu ý rằng khả năng kiểm tra các mô hình của chính họ đang bị thách thức, vì họ có số lượng hạn chế các tác vụ được thiết kế để mất hơn 16 giờ, khiến việc đo lường giới hạn thực sự trên của khả năng mô hình trở nên khó khăn.

Sự tiến bộ nhanh chóng và tăng tốc này đã được gọi là sự tăng trưởng "siêu lũy thừa", với mỗi bước nhảy vọt thế hệ trong khả năng AI dường như lớn hơn bước trước đó. Đường xu hướng gợi ý rằng các khả năng được dự đoán cho năm 2027 đã được đáp ứng, thúc đẩy cả sự phấn khích về việc tăng năng suất và lo lắng về các tác động an ninh của các tác nhân AI ngày càng mạnh mẽ và tự chủ.

Từ phòng thí nghiệm đến thực chiến: 'Thời điểm nguyên tử' của an ninh mạng

Các phát hiện từ nghiên cứu của Palo Alto Networks cung cấp một ví dụ thực tế rõ ràng về ý nghĩa của điểm chuẩn METR. Khả năng tự động hóa một năm làm việc của một nhóm con người cấp cao thành ba tuần thể hiện một sự thay đổi cơ bản trong sự cân bằng giữa tấn công và phòng thủ mạng.

Khả năng này không giới hạn ở một công ty. Các đối thủ cạnh tranh cũng đang tích hợp AI tiên tiến. CrowdStrike Holdings (CRWD), gần đây được vinh danh là công ty dẫn đầu trong Gartner Magic Quadrant 2026 về Trí tuệ Đe dọa Mạng, đang mở rộng liên minh Dự án QuiltWorks của mình để áp dụng AI tiên tiến vào quản lý rủi ro. SentinelOne (S) đã triển khai dịch vụ Wayfinder, sử dụng AI để xác định và ưu tiên các đường dẫn tấn công có thể khai thác, trong khi Okta Inc. (OKTA) đang phát triển các khung mới để quản lý danh tính cho chính các tác nhân AI.

Kiểm tra thực tế: Tỷ lệ thành công 50% có đủ tốt không?

Mặc dù con số 16 giờ là ấn tượng, các nhà phê bình cảnh báo về việc suy diễn quá mức từ điểm chuẩn. Yếu tố hạn chế chính là tỷ lệ thành công 50%. Đối với nghiên cứu và phát triển, nơi một chuyên gia con người có thể xem xét và loại bỏ các nỗ lực thất bại, tỷ lệ thành công 50% cho một tác vụ 16 giờ là mang tính biến đổi. Nó thực sự nhân đôi sản lượng của một kỹ sư con người.

Tuy nhiên, đối với một hệ thống tự động hoàn toàn được triển khai trong môi trường sản xuất, tỷ lệ thất bại 50% là không thể chấp nhận được. "Ngưỡng độ tin cậy cho việc sử dụng thương mại tự động là từ 95% đến 99,9%," nhà nghiên cứu AI Gary Marcus lưu ý trong một phân tích gần đây. Ông lập luận rằng biểu đồ METR, bằng cách chỉ tập trung vào đường thành công 50%, không cho thấy AI đang thu hẹp khoảng cách với độ tin cậy cấp doanh nghiệp nhanh như thế nào. Cuộc tranh luận về việc sẽ mất bao lâu để lấp đầy khoảng cách từ 50% đến 99% thành công là trọng tâm của cuộc thảo luận xung quanh trí tuệ nhân tạo tổng quát (AGI) và tác động thực tế của nó.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.