Nvidia ra mắt mô hình AI tác nhân 120 tỷ tham số
Nvidia đã ra mắt Nemotron 3 Super, một mô hình mở mạnh mẽ với 120 tỷ tham số được thiết kế để cải thiện hiệu quả của các hệ thống AI phức tạp. Mô hình này sử dụng kiến trúc lai kết hợp Mamba, Transformer và định tuyến Mixture-of-Experts (MoE), với chỉ 12 tỷ tham số được kích hoạt trong quá trình suy luận để tối đa hóa hiệu suất. Thiết kế này trực tiếp giải quyết các thách thức về "bùng nổ ngữ cảnh", nơi quy trình làm việc đa tác nhân tạo ra số lượng token gấp 15 lần so với các cuộc trò chuyện tiêu chuẩn, và "chi phí suy nghĩ" liên quan đến việc chạy các mô hình lớn cho mỗi tác vụ phụ. Với cửa sổ ngữ cảnh 1 triệu token, mô hình được xây dựng để xử lý suy luận đa bước, liên tục cho các ứng dụng doanh nghiệp đòi hỏi cao.
Mô hình mới thúc đẩy chuyển đổi sang AI doanh nghiệp tự động
Việc phát hành Nemotron 3 Super báo hiệu một sự chuyển đổi rộng lớn hơn trong ngành từ chatbot đàm thoại sang các tác nhân AI tự động có khả năng lập kế hoạch và thực hiện các quy trình làm việc phức tạp. Nvidia đang định vị công nghệ của mình để thúc đẩy sự thay đổi này trong các lĩnh vực như phát triển phần mềm, phân loại an ninh mạng và tự động hóa công nghiệp, hay "AI vật lý". Bằng cách phát hành mô hình với trọng số, tập dữ liệu và công thức đào tạo mở, công ty khuyến khích các nhà phát triển xây dựng trên nền tảng của mình, củng cố hệ sinh thái phần cứng của họ. Chiến lược này đang thu hút sự chú ý, với các đối tác như Palantir, Dell và Perplexity đã tích hợp Nemotron 3 Super để tự động hóa các dịch vụ và quy trình làm việc của họ.
Chiến lược mở làm tăng rủi ro sở hữu trí tuệ AI
Mặc dù các mô hình mở đẩy nhanh đổi mới và nhu cầu phần cứng, chúng cũng biến trí tuệ cốt lõi của mô hình – trọng số của nó – thành một mục tiêu có giá trị cao cho việc trộm cắp sở hữu trí tuệ. Rủi ro chiến lược là đáng kể, vì kẻ thù có thể sao chép khả năng của mô hình nếu trọng số của nó bị đánh cắp. Mối đe dọa này đã được nhấn mạnh vào năm 2024 khi một kỹ sư Google bị cáo buộc tội trộm cắp bí mật thương mại AI cho các công ty Trung Quốc. Khi các hệ thống AI trở thành cơ sở hạ tầng quan trọng, ngành công nghiệp phải đối mặt với áp lực phải áp dụng các biện pháp bảo mật mạnh mẽ hơn, chẳng hạn như các kiểm soát xác minh đa bên được sử dụng bởi các phòng thí nghiệm như Anthropic để bảo vệ tài sản mô hình nhạy cảm nhất của họ khỏi các mối đe dọa nội bộ và tấn công bên ngoài.