Các hệ thống AI đang tiến gần đến khả năng tự thiết kế và xây dựng thế hệ kế nhiệm mà không cần sự can thiệp của con người, Anthropic cho biết, đồng thời kêu gọi các biện pháp bảo vệ phối hợp trước khi công nghệ vượt quá khả năng quản lý của xã hội.
Các hệ thống AI đang tiến gần đến khả năng tự thiết kế và xây dựng thế hệ kế nhiệm mà không cần sự can thiệp của con người, Anthropic cho biết, đồng thời kêu gọi các biện pháp bảo vệ phối hợp trước khi công nghệ vượt quá khả năng quản lý của xã hội.

Các hệ thống AI đang tiến gần đến khả năng tự thiết kế và xây dựng thế hệ kế nhiệm mà không cần sự can thiệp của con người, Anthropic cho biết, đồng thời kêu gọi các biện pháp bảo vệ phối hợp trước khi công nghệ vượt quá khả năng quản lý của xã hội.
Anthropic cảnh báo rằng sự phát triển AI đang tăng tốc nhanh hơn dự kiến, khi mô hình Claude hiện viết hơn 80% mã được hợp nhất vào kho mã sản xuất của công ty — một cột mốc chỉ ra khả năng tự cải thiện đệ quy, nơi các hệ thống AI tự động tiến bộ mà không cần con người.
"Chúng tôi luôn nhận thấy cách tốt nhất là xã hội hóa khái niệm và về cơ bản cho mọi người thấy điều gì sắp xảy ra," Jack Clark, đồng sáng lập Anthropic, cho biết trong một cuộc phỏng vấn. "Câu chuyện lớn ở đây là những gì chúng tôi thấy là dấu hiệu cho thấy, trái với một số quan điểm phổ biến, tiến bộ AI sẽ tăng tốc trong những năm tới thay vì giữ nguyên hoặc suy giảm."
Sự thay đổi này đã khiến khối lượng mã được xuất xưởng trên mỗi kỹ sư mỗi quý tăng gấp 8 lần so với mức cơ sở giai đoạn 2021–2025 của công ty, theo một bài đăng trên blog hôm thứ Năm do Marina Favaro, trưởng nhóm tại Anthropic Institute, và Clark viết. Đối với các vấn đề kỹ thuật phức tạp khi thiếu thông số kỹ thuật rõ ràng, tỷ lệ thành công của Claude đã tăng lên 76% vào tháng 5 năm 2026 — mức tăng 50 điểm trong sáu tháng. Mô hình Mythos Preview nội bộ của công ty đã đạt được tốc độ tăng gấp 52 lần trong tối ưu hóa mã huấn luyện mô hình AI, so với mức cải thiện điển hình 4 lần của một nhà phát triển lành nghề trong vòng bốn đến tám giờ tái cấu trúc thủ công.
Anthropic cho biết "tự cải thiện đệ quy" có thể đến sớm hơn nhiều so với mức sẵn sàng của hầu hết các tổ chức. Công ty kêu gọi một cơ chế phối hợp giữa các phòng thí nghiệm AI hàng đầu để làm chậm hoặc tạm dừng phát triển nếu rủi ro leo thang, cảnh báo rằng hành động đơn phương của một công ty duy nhất sẽ chỉ chuyển dịch vị thế dẫn đầu chứ không cải thiện an toàn toàn cầu. "Nếu không có cơ chế phối hợp toàn cầu, các công ty và chính phủ sẽ phải đưa ra những quyết định khó khăn về an toàn dưới áp lực cạnh tranh và địa chính trị," Favaro và Clark viết.
Nút thắt cổ chai trong viết mã chuyển từ viết sang xem xét
Dữ liệu nội bộ của Anthropic cho thấy sự cải thiện mô hình AI đã tăng gấp đôi khoảng mỗi bốn tháng, thay vì bảy tháng như quan sát trước đây. Vai trò của con người đang bị thu hẹp ở mỗi bước. Một khi chất lượng mã do con người và AI viết đạt đến mức tương đương — điều Anthropic dự kiến sẽ xảy ra trong năm nay — con người sẽ ngừng viết mã hoàn toàn và chỉ chuyển sang xem xét. Nhưng nếu người xem xét không thể theo kịp tốc độ tạo mã của Claude, việc xem xét của con người trở thành nút thắt cổ chai.
Để đối phó với điều này, Anthropic đã triển khai một trình xem xét tự động dựa trên Claude vào quy trình phát triển, phân tích mọi yêu cầu kéo (pull request) để tìm lỗi kiến trúc, lỗ hổng bảo mật và lỗi hồi quy. Các phân tích hồi cứu cho thấy lớp tự động này đã phát hiện khoảng một phần ba số lỗi sản xuất gây ra các sự cố ngừng hoạt động trong quá khứ trên trang web claude.ai.
Trong một trường hợp từ tháng 4 năm 2026, một kỹ sư của Anthropic đã triển khai Claude để giải quyết một loại lỗi API dai dẳng. Hoạt động tự động, mô hình đã xuất xưởng hơn 800 bản sửa lỗi riêng lẻ, giảm tỷ lệ lỗi xuống 1.000 lần. Kỹ sư giám sát ước tính một nhà phát triển con người sẽ mất bốn năm để thực hiện cùng một khối lượng công việc.
Khoảng trống quản trị và những gì tiếp theo
OpenAI đã công bố những phát hiện của riêng mình về khả năng tự cải thiện đệ quy, mô tả đó là một hiện tượng nguy hiểm tiềm tàng nếu các nhà nghiên cứu không chia sẻ thông tin về nó trong một bài đăng trên blog vào tháng 12 năm 2025. Công ty đang tuyển dụng một nhà nghiên cứu về khả năng sẵn sàng cho tự cải thiện đệ quy như một phần của Nhóm Nghiên cứu An toàn.
Anthropic có kế hoạch tổ chức các cuộc thảo luận với các nhà hoạch định chính sách, nhà nghiên cứu, nhóm xã hội dân sự và các công ty AI khác trong những tháng tới để xem xét cách quản lý rủi ro và cải thiện cơ chế phối hợp. Bộ phận nghiên cứu của công ty, Anthropic Institute, sẽ nghiên cứu các hệ thống cần thiết để hỗ trợ khả năng làm chậm lại.
Những tác động vượt ra ngoài các phòng thí nghiệm AI. Anthropic, đã nộp đơn bí mật xin phát hành cổ phiếu lần đầu ra công chúng (IPO) tại Mỹ hôm thứ Hai sau một vòng gọi vốn định giá công ty ở mức 965 tỷ USD, cho biết khả năng tự cải thiện đệ quy hoàn chỉnh "có thể làm tăng rủi ro con người mất kiểm soát đối với các hệ thống AI." Đối với các nhà đầu tư, sự tăng tốc đặt ra câu hỏi về lợi thế cạnh tranh: nếu AI có thể xây dựng AI tốt hơn, lợi thế sẽ chuyển từ dữ liệu huấn luyện độc quyền và tài năng kỹ thuật con người sang khả năng truy cập tính toán và nghiên cứu sự phù hợp — những lĩnh vực mà các công ty có tiềm lực tài chính mạnh như Anthropic, OpenAI và Google nắm giữ lợi thế cấu trúc.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.