Mô hình Qwen 3.6 mới của Alibaba thách thức các đối thủ trong lập trình AI

(P1) Alibaba Group Holding Ltd. (09988.HK) đã phát hành Qwen3.6-Plus, mô hình ngôn ngữ lớn thế hệ mới mà họ khẳng định là AI mạnh nhất Trung Quốc cho việc lập trình, giúp công ty cạnh tranh tốt hơn với các đối thủ trong nước và các nhà dẫn dắt AI toàn cầu.

(P2) Trong một thông cáo, Alibaba cho biết mô hình này thể hiện một bước đột phá mới trong lập trình tác nhân đa phương thức, cho phép AI tạo mã dựa trên hướng dẫn bằng một câu duy nhất trong một quy trình gọi là "vibe coding".

(P3) Công ty tuyên bố rằng trong các đánh giá uy tín, bao gồm dòng SWE-bench và các nhiệm vụ tác nhân thực tế như Claw-Eval, Qwen 3.6 đã vượt qua các mô hình như GLM-5 và Kimi-K2.5, vốn có kích thước tham số lớn gấp hai đến ba lần. Thông báo cũng lưu ý rằng mô hình này đang tiến gần đến hiệu suất của các mô hình lập trình hàng đầu thế giới thuộc dòng Claude.

(P4) Việc phát hành Qwen3.6-Plus có thể nâng cao đáng kể vị thế cạnh tranh của Alibaba trong lĩnh vực AI, đặc biệt là trong thị trường công cụ dành cho nhà phát triển và phát triển phần mềm bằng AI. Điều này có thể thu hút nhiều người dùng hơn đến với nền tảng đám mây của mình, gây áp lực lên các đối thủ trong nước như Tencent và Baidu.

Hiệu suất chuẩn của Qwen 3.6

Theo các chi tiết do Alibaba cung cấp, sức mạnh của mô hình Qwen 3.6 nằm ở hiệu quả và khả năng tác nhân tiên tiến. Có báo cáo cho rằng nó đã vượt qua các mô hình lớn hơn từ các đối thủ Trung Quốc là Zhipu AI (GLM) và Moonshot AI (Kimi) trên các bài kiểm tra chuẩn quan trọng. Các thử nghiệm này đánh giá khả năng của mô hình trong việc xử lý các tác vụ lập trình cấp kho lưu trữ phức tạp, đòi hỏi giải quyết vấn đề tự chủ.

Mô hình có thể tự chủ phân rã nhiệm vụ, lập kế hoạch lộ trình thực thi, sau đó kiểm tra và tinh chỉnh đầu ra mã của chính nó cho đến khi nhiệm vụ hoàn thành. Hành vi "tác nhân" này là trọng tâm chính trong ngành AI, khi nó chuyển đổi các mô hình từ trợ lý đơn giản thành những người tham gia tích cực vào quy trình phát triển. Mặc dù Alibaba tuyên bố hiệu suất tiếp cận dòng Claude của Anthropic, nhưng họ không tiết lộ các điều kiện thử nghiệm cụ thể hoặc điểm số đối đầu trực tiếp.

Tác động đối với thị trường đám mây AI

Đối với Alibaba, một mô hình lập trình hàng đầu là tài sản quan trọng cho bộ phận đám mây của mình. Bằng cách cung cấp một trợ lý lập trình AI gốc mạnh mẽ, công ty có thể tạo ra một hệ sinh thái gắn kết hơn cho các nhà phát triển và khách hàng doanh nghiệp trên nền tảng của mình. Một mô hình vượt trội có thể giảm chi phí và thời gian phát triển cho khách hàng, khiến Alibaba Cloud trở thành một lựa chọn hấp dẫn hơn so với các nhà cung cấp khác.

Động thái này làm gia tăng cuộc chiến giá cả và hiệu suất AI tại Trung Quốc. Khi các gã khổng lồ công nghệ địa phương chạy đua để đạt được hiệu suất tối tân, chiến trường chính đang chuyển dịch từ các khả năng cơ bản sang các kỹ năng chuyên biệt, giá trị cao như lập trình và thực thi tác vụ tác nhân. Thành công trong lĩnh vực này là yếu tố then chốt để chiếm lĩnh làn sóng chi tiêu tiếp theo của doanh nghiệp vào AI.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.