- 阿里巴巴推出 Qwen3.7-Max,在全球 Arena 盲测中位居中国模型首位。
- 该模型通过自主编程,在复杂的智能体任务中实现了 10 倍的推理速度提升。
- Qwen3.7-Max 的表现已接近 OpenAI、谷歌和 Anthropic 等美国领先模型。

(P1) 阿里巴巴发布了其下一代旗舰模型 Qwen3.7-Max,将其定位为中国顶尖的 AI 竞争者,其性能已接近 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3 等全球领先模型。该模型在具有影响力的 Arena 全球大模型盲测中,位居所有中国实验室之首。
(P2) 该公司在公告中表示:“Qwen 3.7 是针对当前的智能体趋势重新设计的,在编程和推理等核心能力上取得了突破。”这一重点体现在该模型能够自主完成一项复杂的、长达 35 小时的智能体任务。
(P3) 该模型的预览版本 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 在 LM Arena 基准测试中,文本能力全球排名第 13 位,视觉能力排名第 16 位,超越了 Kimi-K2.6 和 DeepSeek-v4-pro 等其他中国模型。在一次关键演示中,阿里巴巴报告称,Qwen3.7-Max 通过使用自我进化来重写核心内核,在特定任务上的推理速度提升了 10 倍。
(P4) 此次发布加剧了全球 AI 竞争,巩固了阿里巴巴在利润丰厚的云计算市场中对抗竞争对手谷歌和微软的地位。此举还凸显了中国 AI 开发者的一个广泛趋势,即保持其最强大模型的专有性,转向付费 API 访问,以资助训练最先进 AI 所需的巨额计算支出。
阿里巴巴正将其最新模型引向不断增长的 AI 智能体领域——即可以执行复杂、多步骤任务的自主系统。该公司强调了一项重大成就,即 Qwen3.7-Max 在一个新的芯片平台上连续运行了 35 小时。
在此过程中,该模型自主使用了超过 1,000 次工具调用,并进行自我编程以进化一个关键的软件内核。这种自我优化行为导致该特定功能的推理速度提高了十倍,展示了该模型在推理和代码生成能力方面的跨越。
Qwen3.7-Max 的发布距离其前身 Qwen3.6 系列仅一个月,标志着阿里巴巴开发周期的加速。然而,这也证实了商业化战略的转变。继 Qwen3.6 之后,新的旗舰模型将是专有的。
这种放弃顶级模型完全开源的策略正成为中国主要 AI 实验室的共同选择。在日益增长的商业化压力和高昂算力成本的推动下,各公司正寻求通过付费应用程序接口 (API) 将其 AI 研究变现。这使得企业客户能够在强大的基础模型之上构建应用程序,同时提供收入流以资助未来的研发。
本文仅供参考,不构成投资建议。