Lộ trình Kiểm soát AI năm 2026 của Google DeepMind nhắm vào các tác nhân AI bất trị

Google DeepMind đã công bố một kế hoạch lấy cảm hứng từ an ninh mạng nhằm kiềm chế các tác nhân AI bất trị, đánh dấu khuôn khổ công khai chi tiết nhất của công ty để quản lý rủi ro từ các hệ thống ngày càng tự chủ.

Google DeepMind hôm thứ Năm đã công bố "Lộ trình Kiểm soát AI," một khung chiến lược được thiết kế để ngăn chặn các tác nhân AI tiên tiến hành động trái với lợi ích con người. Kế hoạch, được công bố trong bối cảnh các hệ thống AI tác nhân ngày càng mạnh mẽ và tự chủ hơn, vay mượn trực tiếp từ các chiến lược ngăn chặn an ninh mạng như kiến trúc zero-trust và kiểm soát truy cập đặc quyền tối thiểu.

"Giống như an ninh mạng bảo vệ hệ thống khỏi các tác nhân độc hại, chúng ta cần các biện pháp bảo vệ tương tự cho các tác nhân AI có thể đi chệch khỏi hành vi dự kiến của chúng," một phát ngôn viên của DeepMind cho biết. "Lộ trình này vạch ra các lớp bảo vệ — từ môi trường thực thi sandbox đến giám sát hành vi theo thời gian thực — có thể ngăn chặn các tác nhân trước khi chúng gây ra tác hại."

Lộ trình được đưa ra trong bối cảnh ngành công nghiệp đang chạy đua triển khai AI tác nhân — các hệ thống có thể độc lập lập kế hoạch, thực thi các tác vụ đa bước và tương tác với các công cụ và API bên ngoài. Không giống như các mô hình ngôn ngữ lớn truyền thống chỉ tạo ra văn bản để phản hồi các lời nhắc, các tác nhân có thể hành động trong thế giới số: viết mã, thực hiện giao dịch, quản lý chuỗi cung ứng hoặc kiểm soát cơ sở hạ tầng. Sự tự chủ đó làm xuất hiện các dạng thức lỗi mới, bao gồm lệch mục tiêu, hack phần thưởng và các chuỗi leo thang ngoài ý muốn.

Khung chiến lược của DeepMind đề xuất ba lớp ngăn chặn: cô lập thời gian chạy nhằm hạn chế quyền truy cập của tác nhân chỉ vào các hệ thống và dữ liệu cần thiết cho một tác vụ cụ thể; rào cản hành vi giám sát hành động của tác nhân so với các ranh giới chính sách được xác định trước; và cơ chế can thiệp có sự tham gia của con người có thể chấm dứt phiên làm việc của tác nhân khi phát hiện hành vi bất thường. Cách tiếp cận này phản ánh cách các đội an ninh doanh nghiệp phân đoạn mạng lưới và thực thi các quyền đặc quyền tối thiểu.

Lợi thế cạnh tranh trong An toàn AI

Lộ trình này định vị Google DeepMind là người dẫn đầu trong lĩnh vực an toàn AI vào thời điểm các đối thủ đang chạy đua triển khai các sản phẩm tác nhân. OpenAI đã phát hành Operator, tác nhân của họ có khả năng duyệt web và thực hiện các tác vụ một cách tự chủ. Claude của Anthropic hiện bao gồm tính năng "sử dụng máy tính" cho phép mô hình tương tác với các ứng dụng trên desktop. Microsoft đã nhúng các tác nhân Copilot vào hệ sinh thái Office và Azure, trong khi Meta đã mã nguồn mở các khung tác nhân của mình.

Mỗi công ty trong số này đều phải đối mặt với cùng một thách thức cơ bản: làm thế nào để cung cấp cho các tác nhân đủ quyền tự chủ để hữu ích mà không tạo ra rủi ro không thể chấp nhận. Một tác nhân sai lệch ở quy mô lớn — một tác nhân xóa dữ liệu khách hàng, thực hiện các giao dịch trái phép hoặc leo thang đặc quyền vượt quá thẩm quyền — có thể gây ra thiệt hại hàng tỷ đô la và kích hoạt một làn sóng phản ứng quy định làm tê liệt toàn bộ ngành.

Lila Ibrahim, giám đốc phụ trách sẵn sàng AI của Google DeepMind, đã làm việc với các chính phủ và nhà hoạch định chính sách để chuẩn bị cho kỷ nguyên tác nhân. Trong một bài tập mô phỏng gần đây với các quan chức Singapore, nhóm của bà đã mô phỏng cách AI có thể định hình lại việc khám phá bệnh tật và điều đó có ý nghĩa gì đối với quy định y tế và các thể chế khoa học. "Chúng tôi biết công nghệ đang đi về đâu, vì vậy chúng tôi có thể tiếp cận các cuộc đối thoại này một cách hợp tác hơn," Ibrahim nói với Fast Company, "hiểu rằng công nghệ chưa xuất hiện, nhưng chúng ta cần làm gì để chuẩn bị cho những gì sắp tới."

Ý nghĩa của Lộ trình đối với Nhà đầu tư

Đối với các nhà đầu tư, lộ trình này báo hiệu rằng Alphabet Inc., công ty mẹ của Google, đang có lập trường chủ động về quản trị AI — một yếu tố có thể ảnh hưởng đến kết quả quy định và định vị cạnh tranh. Các công ty chứng minh được các khung an toàn mạnh mẽ có thể chịu sự giám sát quy định nhẹ nhàng hơn và giành được lòng tin lớn hơn từ doanh nghiệp, đặc biệt là trong các ngành được quản lý chặt chẽ như y tế, tài chính và cơ sở hạ tầng quan trọng.

Thời điểm này rất đáng chú ý. Noam Shazeer, đồng trưởng dự án Gemini của Google, gần đây đã rời công ty để gia nhập OpenAI, nhấn mạnh cuộc cạnh tranh nhân tài khốc liệt trong lĩnh vực AI. Khi năng lực của các tác nhân AI tăng tốc, các công ty có thể triển khai chúng một cách an toàn — và thuyết phục được các cơ quan quản lý cũng như khách hàng về sự an toàn đó — có thể chiếm được thị phần không cân xứng.

Alphabet đang giao dịch ở mức gấp khoảng 22 lần thu nhập dự phóng. Nếu khung an toàn của DeepMind trở thành tiêu chuẩn ngành, nó có thể tạo ra một hào cạnh tranh mà các đối thủ không có các biện pháp bảo vệ tương đương sẽ khó vượt qua. Ngược lại, một sự cố tác nhân AI nghiêm trọng tại bất kỳ phòng thí nghiệm AI lớn nào cũng có thể mời gọi các quy định làm chậm quá trình triển khai trên toàn ngành, qua đó nén chặt bội số định giá của toàn bộ lĩnh vực.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.