阿里巴巴发布 Qwen 3.6 新模型，挑战 AI 编程领域竞争对手

(P1) 阿里巴巴集团控股有限公司（09988.HK）发布了其新一代大语言模型 Qwen3.6-Plus。该公司声称这是中国最强的编程 AI，旨在提升其与国内对手及全球 AI 领导者的竞争力。

(P2) 阿里巴巴在官方发布中表示，该模型在多模态智能体编程方面实现了新突破，使 AI 能够通过单一的句子指令生成代码，这一过程被称为“氛围编程”（vibe coding）。

(P3) 该公司表示，在包括 SWE-bench 系列和 Claw-Eval 等真实世界智能体任务在内的权威评估中，Qwen 3.6 的表现超越了 GLM-5 和 Kimi-K2.5，而后两者的参数量通常是其两到三倍。公告还指出，该模型的性能正接近全球领先的 Claude 系列编程模型。

(P4) Qwen3.6-Plus 的发布可能会显著提升阿里巴巴在 AI 领域的竞争地位，特别是在开发者工具和 AI 驱动的软件开发市场。这可能会为其云平台吸引更多用户，并对腾讯、百度等国内竞争对手施加压力。

Qwen 3.6 的基准测试表现

根据阿里巴巴提供的细节，Qwen 3.6 模型的优势在于其效率和先进的智能体能力。据报道，它在关键基准测试中超越了来自中国竞争对手智谱 AI (GLM) 和月之暗面 (Kimi) 的更大规模模型。这些测试旨在评估模型处理需要自主解决问题的复杂仓库级编程任务的能力。

该模型能够自主拆解任务、规划执行路径，并对其代码输出进行测试和改进，直到任务完成。这种“智能体”行为是 AI 行业的重点关注领域，因为它使模型从简单的助手转变为开发流程中的积极参与者。虽然阿里巴巴声称其性能接近 Anthropic 的 Claude 系列，但尚未披露具体的测试条件或直接的对标评分。

对于阿里巴巴而言，顶尖的编程模型是其云业务的关键资产。通过提供强大的原生 AI 编程助手，公司可以在其平台上为开发者和企业客户建立更具粘性的生态系统。卓越的模型可以降低客户的开发成本和周期，使阿里云相比其他供应商更具吸引力。

此举加剧了中国 AI 领域的价格与性能之争。随着本土科技巨头竞相追求顶尖性能，主战场正从基础能力转向编程和智能体任务执行等专业化、高价值技能。在这一领域的成功，对于抢占下一波企业级 AI 支出至关重要。

本文仅供参考，不构成投资建议。