Anthropic thách thức thị trường bảo mật 50 tỷ USD với dịch vụ đánh giá mã AI giá 25 USD

Edgen Stock·Mar 10 2026, 16:37

Chia sẻ đến

Chia sẻ đến

Sao chép liên kết

Các điểm chính

Anthropic đã ra mắt tính năng Đánh giá mã do AI cung cấp, nhằm mục đích tự động hóa và giảm đáng kể chi phí kiểm toán bảo mật phần mềm. Công cụ mới này sử dụng một nhóm tác nhân AI để tìm lỗi và lỗ hổng trong các bản đệ trình mã, đặt ra mối đe dọa trực tiếp cho các công ty bảo mật hiện có.

Phá vỡ chi phí lớn: Tính năng này có giá 15 đến 25 USD cho mỗi lần đánh giá, cạnh tranh trực tiếp với các công ty bảo mật truyền thống như Snyk và Checkmarx, những công ty tính phí lên tới 50.000 USD hàng năm.
Hiệu quả đã được chứng minh: Thử nghiệm nội bộ cho thấy công cụ này đã tăng tỷ lệ yêu cầu kéo (pull request) có phản hồi thực chất từ 16% lên 54% và tìm thấy các vấn đề trong 84% các bản đệ trình mã lớn.
Độ chính xác cao: Hệ thống đã chứng minh tỷ lệ dương tính giả dưới 1%, một cải thiện đáng kể so với các công cụ truyền thống vốn nổi tiếng với tỷ lệ cảnh báo không chính xác cao.

AI Cắt Giảm Chi Phí Kiểm Toán Mã Đến 2.000 Lần

Anthropic đã ra mắt tính năng đánh giá mã tự động cho sản phẩm Claude Code của mình, trực tiếp thách thức ngành bảo mật ứng dụng (AppSec) trị giá 50 tỷ USD. Công cụ mới này triển khai một nhóm các tác nhân AI chuyên biệt để phân tích các bản đệ trình mã tìm lỗi và lỗ hổng bảo mật, giới thiệu một mô hình định giá đột phá gây đe dọa cho các đối thủ hiện tại.

Chi phí trung bình của tính năng này chỉ từ 15 đến 25 USD cho mỗi lần đánh giá, được tính toán dựa trên lượng token sử dụng. Cấu trúc định giá này đặt ra mối đe dọa nghiêm trọng cho các nhà cung cấp bảo mật hiện có như Snyk, Checkmarx và Veracode, những công ty có mô hình kinh doanh dựa vào phí cấp phép doanh nghiệp hàng năm có thể vượt quá 50.000 USD. Tiềm năng giảm chi phí đến 2.000 lần báo hiệu một sự kiện định giá lại trên toàn thị trường đối với các dịch vụ bảo mật phần mềm.

Các Thử Nghiệm Nội Bộ Tiết Lộ AI Tìm Thấy Lỗi Trong 84% Cơ Sở Mã Lớn

Dữ liệu từ việc triển khai nội bộ của Anthropic chứng minh tác động tức thì của công cụ này đối với chất lượng và hiệu quả phát triển. Trước khi triển khai, chỉ 16% các yêu cầu kéo (PR) mã nhận được phản hồi đánh giá thực chất từ các kỹ sư. Sau khi triển khai trình đánh giá AI, con số này đã tăng lên 54%. Hệ thống đã xác định lỗi trong 84% các PR lớn (trên 1.000 dòng), phát hiện trung bình 7,5 vấn đề mỗi lần gửi.

Quan trọng là, các phát hiện của AI có độ chính xác cao, với các kỹ sư đánh dấu chưa đến 1% các đánh giá tự động là không chính xác. Tỷ lệ dương tính giả thấp này giải quyết một điểm yếu lớn của các công cụ quét cũ, vốn thường tạo ra quá nhiều "nhiễu" khiến các nhà phát triển bỏ qua cảnh báo. Bằng cách tập trung vào các lỗi logic thực sự và lỗ hổng bảo mật, hệ thống cho phép các nhóm khắc phục các vấn đề quan trọng mà các nhà đánh giá con người có thể bỏ lỡ, như đã thấy trong một trường hợp AI tìm thấy một lỗi ẩn lâu năm trong mã liền kề với một bản cập nhật thông thường.