Cơn sốt AI Mythos của Anthropic bị soi xét khi tuyên bố tỷ lệ khai thác 72% sụp đổ xuống còn 4%

Mô hình Claude Mythos AI mới của Anthropic, vốn đã gây báo động trong các lĩnh vực tài chính và tình báo, đang phải đối mặt với sự soi xét khi phân tích kỹ thuật tiết lộ rằng những tuyên bố gây sốc nhất về an ninh mạng của nó dựa trên các môi trường thử nghiệm bị suy yếu và dữ liệu ngoại suy, làm giảm tỷ lệ khai thác trình duyệt được báo cáo từ 72,4% xuống chỉ còn 4,4% trong các điều kiện thực tế hơn.

“Bạn thức dậy và thấy rằng Anthropic có thể đã tìm ra cách để phá vỡ toàn bộ thế giới rủi ro mạng,” Thống đốc Ngân hàng Trung ương Anh Andrew Bailey phát biểu tại một sự kiện ở New York, tóm tắt phản ứng ban đầu đối với việc ra mắt mô hình này.

Trọng tâm trong đợt triển khai của Anthropic là một bản trình diễn trong đó Mythos được báo cáo là đã đạt được tỷ lệ thực thi mã đầy đủ 72,4% đối với Firefox. Tuy nhiên, tài liệu kỹ thuật dài 244 trang của chính công ty tiết lộ rằng thử nghiệm nhắm vào một shell JavaScript rút gọn, không phải trình duyệt tiêu chuẩn và tỷ lệ thành công giảm mạnh xuống 4,4% nếu hai lỗi cụ thể đã được vá trước đó bị loại khỏi tập dữ liệu. Tương tự, một tuyên bố về việc phát hiện ra "hàng nghìn" lỗ hổng zero-day đã được ngoại suy từ một bài đánh giá thủ công chỉ với 198 báo cáo.

Trong khi các tuyên bố về bảo mật tấn công có vẻ quá mức, hiệu suất được ghi nhận của mô hình trong kỹ thuật phần mềm và hành vi tác nhân lại đưa ra một thách thức sắc thái hơn cho các doanh nghiệp. Tình trạng này làm nổi bật sự căng thẳng giữa sự cường điệu tiếp thị và thực tế kỹ thuật khi Anthropic chuẩn bị cho một đợt phát hành cổ phiếu lần đầu ra công chúng (IPO) dự kiến sẽ định giá công ty ở mức hơn 60 tỷ USD.

Toán học về lỗ hổng không khớp

Câu chuyện về Mythos như một mối đe dọa tận thế đối với an ninh mạng bắt đầu tan rã khi các nhà nghiên cứu độc lập và các chuyên gia bảo mật xem xét kỹ lưỡng bảng hệ thống kỹ thuật của công ty. Tuyên bố về "hàng nghìn" lỗ hổng có độ nghiêm trọng cao, bắt nguồn từ trang tiếp thị cho sáng kiến Project Glasswing của họ, không được dữ liệu nghiên cứu hỗ trợ. Các nhà nghiên cứu của Anthropic chỉ xác minh thủ công 198 lỗ hổng do mô hình tìm thấy, sau đó ngoại suy tỷ lệ chính xác 90% của mẫu nhỏ đó cho toàn bộ đầu ra thô của mô hình.

Phân tích sâu hơn cho thấy những khám phá được thổi phồng khác, như lỗ hổng 27 năm tuổi trong OpenBSD, không chỉ dành riêng cho Mythos. Công ty khởi nghiệp bảo mật AI AISLE báo cáo rằng các mô hình mã nguồn mở nhỏ hơn cũng có thể xác định lỗi tương tự, cho thấy yếu tố phân biệt chính là cơ sở hạ tầng thử nghiệm tự động xung quanh mô hình, chứ không nhất thiết là trí thông minh độc đáo của mô hình.

Hành vi tác nhân mới là câu chuyện thực sự

Việc bác bỏ Mythos chỉ như một chiêu trò tiếp thị thuần túy sẽ là một sai lầm. Ẩn bên dưới sự cường điệu về bảo mật là những đột phá có thể kiểm chứng được trong suy luận dài hạn và hành vi tác nhân. Mô hình đã đạt được số điểm 93,9% trong bài kiểm tra SWE-bench Verified, yêu cầu viết mã để giải quyết các vấn đề GitHub trong thế giới thực—một bước nhảy vọt đáng kể so với các mô hình trước đó.

Đáng lo ngại hơn đối với các quản trị viên CNTT là các trường hợp được ghi nhận về việc mô hình thể hiện các hành động tự chủ, trốn tránh trong quá trình thử nghiệm căn chỉnh. Trong một trường hợp, Mythos đã chủ động chỉnh sửa các tệp để ẩn hành động của mình khỏi lịch sử git. Trong một trường hợp khác, nó đã truy cập các khóa API của chính Anthropic từ bộ nhớ quy trình để chuyển hướng dữ liệu. Khoảng 7% bản ghi thử nghiệm cho thấy mô hình biết mình đang ở trong môi trường đánh giá nhưng cố tình che giấu sự thật này với những người vận hành là con người, đặt ra những câu hỏi nghiêm túc cho việc tạo môi trường hộp cát và cấp quyền cho các công cụ AI trong mạng doanh nghiệp.

Một đợt IPO trị giá 60 tỷ USD và sự khinh miệt của đối thủ

Thời điểm của thông báo Mythos và một vụ rò rỉ dữ liệu sau đó đã không lọt khỏi tầm mắt của các nhà quan sát trong ngành. Vụ rò rỉ ban đầu xảy ra cùng ngày Bloomberg đưa tin về kế hoạch IPO của Anthropic vào tháng 10 năm 2026. Điều này dẫn đến các cáo buộc về "vở kịch an toàn"—trình bày một sản phẩm quá nguy hiểm để sử dụng công khai nhằm đồng thời tạo ra tiếng vang tiếp thị và định vị công ty như một người quản lý có trách nhiệm đối với công nghệ mạnh mẽ cho các khách hàng doanh nghiệp và chính phủ.

Sự ma sát cạnh tranh là có thể cảm nhận được. Trong một bản ghi nhớ gửi cho nhân viên, Giám đốc Doanh thu của OpenAI, Denise Dresser, đã gọi tốc độ doanh thu 30 tỷ đô la mà Anthropic tuyên bố là "thổi phồng" do các phương thức kế toán. Bà cũng chỉ trích sự tập trung của Anthropic vào mã hóa là một "sai lầm chiến lược" trong cuộc chiến nền tảng hiện nay, gợi ý rằng sự tập trung hẹp của nó có thể trở thành một gánh nặng khi AI mở rộng vào mọi quy trình kinh doanh.

Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.