Thách thức AI Trung Quốc DeepSeek đã tăng đáng kể cửa sổ ngữ cảnh của API chính lên 1 triệu token, một sự leo thang đáng kể trong nỗ lực cạnh tranh với các mô hình tiên tiến từ OpenAI, Google và Anthropic. Bản cập nhật không được thông báo này cũng đẩy mốc kiến thức của mô hình lên tháng 5 năm 2025, điều chỉnh dịch vụ dành cho nhà phát triển phù hợp với ứng dụng hướng tới người dùng cuối và báo hiệu một mặt trận mới trong cuộc chiến giành sự chấp nhận AI của doanh nghiệp.
"Tôi đã thử nghiệm API và nhận thấy nó hiện không khác gì ứng dụng chính thức," một nhà phát triển đã viết trên một nền tảng mạng xã hội, phản ánh làn sóng phản hồi của cộng đồng lần đầu tiên phát hiện ra sự thay đổi. "Khả năng xử lý toàn bộ bộ ba tác phẩm 'Tam Thể' trong một lần hiện đã có sẵn thông qua API."
Bản cập nhật thay thế cửa sổ ngữ cảnh 128.000 token trước đó và mốc kiến thức năm 2024. Động thái này được coi rộng rãi là tiền thân cho việc ra mắt chính thức mô hình V4 của DeepSeek, mà người sáng lập Lương Văn Phong đã chỉ ra nội bộ rằng sẽ được phát hành vào cuối tháng 4 năm 2026. Công ty vẫn chưa đưa ra bình luận chính thức về những thay đổi của API.
Sự thúc đẩy mạnh mẽ này phổ cập hóa một tính năng chính mà cho đến gần đây vẫn là một điểm khác biệt lớn cho các mô hình hàng đầu. Bằng cách cung cấp một cửa sổ ngữ cảnh khổng lồ trực tiếp qua API, DeepSeek đang gây áp lực trực tiếp lên giá cả và khả năng của các đối thủ cạnh tranh như Gemini 3.1 Pro của Google và dòng Claude của Anthropic, buộc họ phải bảo vệ giá trị của mình cho các quy trình làm việc doanh nghiệp có lưu lượng cao.
Chiến trường Triệu Token nóng lên
Cuộc đua cung cấp các cửa sổ ngữ cảnh lớn hơn là một khía cạnh quan trọng của cuộc chiến nền tảng AI. Ngữ cảnh lớn hơn cho phép các mô hình xử lý và suy luận trên lượng thông tin khổng lồ—chẳng hạn như toàn bộ kho mã nguồn, báo cáo tài chính hoặc các tác phẩm văn học—trong một lần chạy. Khả năng này rất quan trọng đối với các ứng dụng doanh nghiệp phức tạp trong tài chính, luật pháp và nghiên cứu khoa học.
Google gần đây đã gây tiếng vang với các đại lý nghiên cứu tự trị của riêng mình, Deep Research và Deep Research Max, được xây dựng trên mô hình Gemini 3.1 Pro. Trong khi các đại lý của Google tập trung vào việc kết hợp dữ liệu web với thông tin doanh nghiệp độc quyền, động thái của DeepSeek tập trung vào việc cung cấp khả năng ngữ cảnh quy mô lớn thô như một tiện ích cho nhà phát triển. Bản cập nhật đưa DeepSeek vào cuộc đối thoại trực tiếp với Anthropic, công ty cũng đã biến các cửa sổ ngữ cảnh lớn thành một phần cốt lõi trong dịch vụ của mình. Câu hỏi then chốt đối với các nhà phát triển sẽ là sự đánh đổi giữa chất lượng, độ trễ và chi phí, vì hiệu suất trên ngữ cảnh dài có thể bị giảm sút. Một số nhà phát triển lưu ý rằng hiệu suất của API được cập nhật có cảm giác tương tự như mô hình "nhanh" của DeepSeek, gợi ý về một sự đánh đổi tiềm năng cho cửa sổ mở rộng.
Từ sự khác biệt API đến bệ phóng V4
Bản cập nhật giải quyết sự khác biệt tồn tại từ lâu khi ứng dụng công khai của DeepSeek cung cấp các tính năng tiên tiến hơn API của nó, một nguồn gây thất vọng cho các nhà phát triển xây dựng trên nền tảng này. Việc triển khai âm thầm dẫn đến suy đoán rằng công ty đang tạm thời kết nối API của mình với các máy chủ của ứng dụng trong khi nâng cấp các mô hình cơ bản cho lần ra mắt V4 chính thức.
Động thái này diễn ra khi DeepSeek, vốn lịch sử đã tránh huy động vốn bên ngoài, được cho là đang tham gia thị trường để huy động vốn với mức định giá gần 10 tỷ USD, theo các báo cáo từ The Information. Sự bơm vốn này sẽ cung cấp các nguồn lực cần thiết để cạnh tranh trong cuộc chạy đua vũ trang AI vô cùng tốn kém, nơi việc đào tạo một mô hình tiên tiến duy nhất có thể tốn hàng tỷ đô la chi phí tính toán GPU.
Đối với các nhà đầu tư, sự xuất hiện của DeepSeek như một đối thủ cạnh tranh được tài trợ tốt và mạnh mẽ về mặt kỹ thuật sẽ thêm một biến số mới vào bối cảnh. Mặc dù là một thực thể tư nhân, các hành động của nó có thể tác động đến các công ty AI niêm yết công khai bằng cách buộc giảm giá, thúc đẩy tốc độ đổi mới và tiềm năng chiếm lĩnh thị phần từ các nhà phát triển và khách hàng doanh nghiệp đang tìm kiếm các mô hình hiệu quả về chi phí và công suất cao. Lần ra mắt DeepSeek V4 sắp tới sẽ là một bài kiểm tra quan trọng về việc liệu hiệu suất của nó có thực sự thách thức sự thống trị của các mô hình từ Google và OpenAI hay không.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.