- 阿里巴巴推出 Qwen3.7-Max,在全球 Arena 盲測中位居中國模型首位。
- 該模型通過自主編程,在複雜的智能體任務中實現了 10 倍的推理速度提升。
- Qwen3.7-Max 的表現已接近 OpenAI、谷歌和 Anthropic 等美國領先模型。

(P1) 阿里巴巴發佈了其下一代旗艦模型 Qwen3.7-Max,將其定位為中國頂尖的 AI 競爭者,其性能已接近 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3 等全球領先模型。該模型在具有影響力的 Arena 全球大模型盲測中,位居所有中國實驗室之首。
(P2) 該公司在公告中表示:「Qwen 3.7 是針對當前的智能體趨勢重新設計的,在編程和推理等核心能力上取得了突破。」這一重點體現在該模型能夠自主完成一項複雜的、長達 35 小時的智能體任務。
(P3) 該模型的預覽版本 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 在 LM Arena 基準測試中,文本能力全球排名第 13 位,視覺能力排名第 16 位,超越了 Kimi-K2.6 和 DeepSeek-v4-pro 等其他中國模型。在一次關鍵演示中,阿里巴巴報告稱,Qwen3.7-Max 通過使用自我進化來重寫核心內核,在特定任務上的推理速度提升了 10 倍。
(P4) 此次發佈加劇了全球 AI 競爭,鞏固了阿里巴巴在利潤豐厚的雲端運算市場中對抗競爭對手谷歌和微軟的地位。此舉還凸顯了中國 AI 開發者的一個廣泛趨勢,即保持其最強大模型的專有性,轉向付費 API 訪問,以資助訓練最先進 AI 所需的巨額計算支出。
阿里巴巴正將其最新模型引向不斷增長的 AI 智能體領域——即可以執行複雜、多步驟任務的自主系統。該公司強調了一項重大成就,即 Qwen3.7-Max 在一個新的芯片平台上連續運行了 35 小時。
在此過程中,該模型自主使用了超過 1,000 次工具調用,並進行自我編程以進化一個關鍵的軟件內核。這種自我優化行為導致該特定功能的推理速度提高了十倍,展示了該模型在推理和代碼生成能力方面的跨越。
Qwen3.7-Max 的發佈距離其前身 Qwen3.6 系列僅一個月,標誌著阿里巴巴開發週期的加速。然而,這也證實了商業化策略的轉變。繼 Qwen3.6 之後,新的旗艦模型將是專有的。
這種放棄頂級模型完全開源的策略正成為中國主要 AI 實驗室的共同選擇。在日益增長的商業化壓力和高昂算力成本的推動下,各公司正尋求通過付費應用程序接口 (API) 將其 AI 研究變現。這使得企業客戶能夠在強大的基礎模型之上構建應用程序,同時提供收入流以資助未來的研發。
本文僅供參考,不構成投資建議。