JPMorgan: Lợi thế chi phí gấp 40 lần của DeepSeek V4 gây áp lực lên 2 đối thủ AI Trung Quốc

Một báo cáo của JPMorgan cho thấy mô hình ngôn ngữ lớn V4 của DeepSeek có lợi thế về chi phí cấu trúc đang gây áp lực lên các đối thủ AI Trung Quốc là KNOWLEDGE ATLAS (02513.HK) và MINIMAX-W (00100.HK). Bản phân tích, được công bố ba tuần sau khi ra mắt mô hình V4, cho thấy chỉ có cơ sở hạ tầng độc quyền của DeepSeek mới có thể vận hành mô hình ở hiệu quả kinh tế cao nhất, tạo ra một động lực cạnh tranh mới trong lĩnh vực đang phát triển nhanh chóng.

Báo cáo của ngân hàng nhấn mạnh lợi thế trực tiếp về cấu trúc trong cách mô hình xử lý việc tái sử dụng bộ nhớ đệm tiền tố, mật độ lưu lượng và phân bổ tính toán. "Về hiệu suất đầu vào khớp bộ nhớ đệm (cache-hit), có khoảng cách khoảng 40 lần giữa API chính thức của DeepSeek và các kênh đám mây của bên thứ ba," JPMorgan lưu ý. Công ty kết luận rằng trong khi trọng số mô hình có thể được phân phối, đường cong chi phí cơ bản thì không, mang lại cho DeepSeek một lợi thế đáng kể.

Theo dữ liệu từ OpenRouter, việc ra mắt DeepSeek V4 không dẫn đến sự sụt giảm tương ứng trong việc sử dụng cho các đối thủ cạnh tranh như GLM và MiniMax, cho thấy thị trường đang trải qua sự tăng trưởng bị hạn chế về nguồn cung thay vì thay thế bằng không. Báo cáo định khung thị trường với DeepSeek V4-Pro định nghĩa ranh giới chi phí thấp và GLM-5.1 của KNOWLEDGE ATLAS neo giữ đầu phân khúc được ưa chuộng cao, khiến mô hình M2.7 của MINIMAX bị kẹt ở giữa.

Đối với các nhà đầu tư, JPMorgan đã chỉ định xếp hạng "Tăng tỷ trọng" (Overweight) cho cả KNOWLEDGE ATLAS và MINIMAX-W, với mục tiêu giá lần lượt là 950 HKD và 1,100 HKD. Tuy nhiên, báo cáo nhấn mạnh rằng cả hai công ty phải tăng cường định vị chiến lược để cạnh tranh hiệu quả với hiệu quả chi phí của DeepSeek.

Phân khúc cao cấp của Zhipu AI bị đe dọa

Đối với KNOWLEDGE ATLAS, đơn vị vận hành mô hình Zhipu AI, JPMorgan tin rằng việc kiếm tiền của họ hiện phụ thuộc vào việc mở rộng vị thế dẫn đầu mô hình. Mặc dù GLM-5.1 của họ hiện đang xếp trên V4 của DeepSeek trong các đánh giá, biện minh cho mức giá cao hơn, nhưng khoảng cách dẫn đầu đó phải được nới rộng. Để duy trì quyền lực định giá, phiên bản GLM tiếp theo cần mở rộng lợi thế ưu tiên trong các nhiệm vụ phức tạp liên quan đến quy trình làm việc như mã hóa dựa trên tác nhân và suy luận ngữ cảnh dài, nơi chi phí thử lại và chất lượng quan trọng hơn chi phí token thô. Nếu không làm được như vậy, họ có thể mất những khách hàng nhạy cảm về giá vào tay DeepSeek.

Lượng sử dụng AI của Trung Quốc vượt Mỹ trong 3 tuần

Sự cạnh tranh gay gắt diễn ra khi việc sử dụng AI của Trung Quốc tiếp tục tăng vọt. Theo các ước tính mới nhất từ OpenRouter cho tuần từ 11-17 tháng 5, việc sử dụng token mô hình lớn của Trung Quốc gấp 1,81 lần so với Hoa Kỳ, đánh dấu tuần thứ ba liên tiếp nước này giữ vị trí hàng đầu toàn cầu. Các mô hình Trung Quốc ghi nhận mức sử dụng token là 7,693 nghìn tỷ, trong khi các mô hình Hoa Kỳ có mức sử dụng là 4,24 nghìn tỷ. Hai trong số ba mô hình hàng đầu theo mức sử dụng token toàn cầu là của Trung Quốc, bao gồm bản xem trước Hy3 của TENCENT (00700.HK), đứng thứ nhất với mức tăng sử dụng 210% so với tuần trước lên 2,66 nghìn tỷ token.

Trong khi đó, MINIMAX đối mặt với áp lực gia tăng đối với đề xuất giá trị dựa trên cơ sở hạ tầng. Vốn là một đối thủ cạnh tranh về thông lượng và độ trễ, giờ đây họ phải đối mặt với API chi phí thấp, ngữ cảnh một triệu của DeepSeek và một ngăn xếp dịch vụ có vẻ hiệu quả hơn. JPMorgan gợi ý rằng phiên bản kế nhiệm của mô hình M2.7 của MiniMax sẽ cần chứng minh rằng nó có thể mang lại tổng chi phí thấp hơn thông qua ít chu kỳ và lần thử lại hơn để duy trì sự khác biệt.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.