DeepSeek V4 thách thức các đối thủ với cửa sổ ngữ cảnh 1 triệu token

Dòng mô hình V4 mới của DeepSeek giúp cắt giảm chi phí suy luận và hỗ trợ ngữ cảnh một triệu token, một sự kết hợp có thể thúc đẩy sự chuyển dịch của doanh nghiệp từ các chatbot đơn giản sang các tác nhân AI tự chủ, phức tạp.

Công ty AI Trung Quốc DeepSeek đã phát hành dòng mô hình V4, thách thức các đối thủ Hoa Kỳ bằng một hệ thống hỗ trợ cửa sổ ngữ cảnh một triệu token với mức chi phí mà họ tuyên bố là đã giảm đáng kể. Việc ra mắt làm gia tăng sự cạnh tranh AI giữa Trung Quốc và Hoa Kỳ, diễn ra ngay sau khi Nhà Trắng cáo buộc các thực thể Trung Quốc nỗ lực đánh cắp công nghệ AI của Mỹ.

"Điều này giải quyết các vấn đề tồn tại từ lâu về hiệu suất chậm hơn và chi phí cao hơn liên quan đến độ dài ngữ cảnh lớn, đánh dấu một bước ngoặt thực sự cho ngành công nghiệp," Zhang Yi, người sáng lập công ty nghiên cứu công nghệ iiMedia, nói với AFP.

Dòng sản phẩm mới bao gồm hai phiên bản: V4-Pro với 1,6 nghìn tỷ tham số cho các nhiệm vụ phức tạp và V4-Flash tiết kiệm hơn với 284 tỷ tham số. DeepSeek tuyên bố khả năng "kiến thức thế giới" của V4-Pro chỉ đứng sau mô hình Gemini mới nhất của Google. Hệ thống này cũng được tối ưu hóa để chạy trên chip của gã khổng lồ công nghệ Trung Quốc Huawei, với các sản phẩm Ascend SuperPoD đang hỗ trợ dòng V4.

Việc tăng hiệu quả dự kiến sẽ thúc đẩy nhu cầu hạ nguồn cho AI tác nhân (Agentic AI), theo một báo cáo từ CICC. Ngân hàng đầu tư này cho biết họ lạc quan về các nhà phát triển mô hình Zhipu (02513.HK) and MiniMax (00100.HK), tin rằng họ có vị thế tốt để hưởng lợi từ tiến bộ công nghệ và thị trường ngày càng mở rộng cho các nhiệm vụ AI phức tạp, dài hạn.

Kiến trúc V4 nhằm giải quyết vấn đề chi phí ngữ cảnh dài

Sự đổi mới cốt lõi trong dòng V4 là cơ chế chú ý hỗn hợp được thiết kế để giảm chi phí tính toán và bộ nhớ thường liên quan đến các cửa sổ ngữ cảnh lớn. Bằng cách tối ưu hóa FLOPs suy luận đơn token và việc sử dụng KV Cache, DeepSeek đặt mục tiêu biến các mô hình quy mô triệu token trở nên khả thi về mặt thương mại cho các ứng dụng chính thống.

Sự tập trung vào hiệu quả này được phản ánh trong giá API của nó. Theo các mức giá được công bố, mô hình DeepSeek V4 Pro có giá 1,74 đô la cho mỗi triệu token đầu vào và 3,48 đô la cho đầu ra. Điều này định vị nó một cách cạnh tranh so với các mô hình hiệu suất cao khác. Để so sánh, MiMo-V2.5-Pro mới phát hành của Xiaomi có giá 1,00 đô la cho đầu vào và 3,00 đô la cho đầu ra, trong khi Claude Opus 4.7 mạnh mẽ của Anthropic có giá cao hơn đáng kể với 5,00 đô la cho đầu vào và 25,00 đô la cho đầu ra.

AI tác nhân và Nguồn mở thúc đẩy cạnh tranh

Chiến lược của DeepSeek dường như tập trung vào lĩnh vực AI tác nhân đang phát triển. Công ty cho biết mô hình V4 của họ được tối ưu hóa cho các khung tác nhân AI phổ biến như OpenClaw và CodeBuddy, cho phép AI tự chủ hoàn thành các nhiệm vụ phức tạp thay mặt người dùng. Phân khúc thị trường này đã chứng kiến sự cạnh tranh gay gắt, với các mô hình như MiMo-V2.5-Pro của Xiaomi chứng minh hiệu quả cao trên các tiêu chuẩn tác nhân.

Một phần chiến lược của DeepSeek bao gồm việc cung cấp các hệ thống của mình dưới dạng nguồn mở, trái ngược với các mô hình độc quyền từ OpenAI, Google và Anthropic. Cách tiếp cận này đã thúc đẩy việc áp dụng bởi các thành phố và doanh nghiệp Trung Quốc nhưng cũng thu hút sự giám sát. Nhà Trắng gần đây đã cáo buộc các công ty Trung Quốc sử dụng "các chiến dịch chưng cất quy mô công nghiệp để đánh cắp AI của Mỹ", một tuyên bố mà Bắc Kinh gọi là "vô căn cứ". Cách tiếp cận nguồn mở của DeepSeek, kết hợp với các tuyên bố về hiệu suất và khả năng tương thích với phần cứng trong nước, đánh dấu một cột mốc quan trọng trong nỗ lực của Trung Quốc nhằm xây dựng một ngành công nghiệp AI tự lực.

Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.