- アリババがQwen3.7-Maxをリリースし、グローバルなArenaブラインド・ベンチマーク・テストで中国製モデルとして首位を獲得しました。
- 同モデルは自律プログラミングを通じて、複雑なエージェント・タスクにおいて推論速度を10倍に向上させました。
- Qwen3.7-Maxの性能は、OpenAI、Google、Anthropicなどの主要な米国製モデルに肉薄しています。

(P1) アリババは次世代フラッグシップモデル「Qwen3.7-Max」をリリースしました。これは、OpenAIのGPT-4やAnthropicのClaude 3といった世界的な主要モデルに匹敵する性能を持つ、中国トップのAI対抗馬として位置づけられています。同モデルは、影響力のあるArenaグローバル大規模モデルブラインドテストにおいて、すべての中国系研究所の中で首位を獲得しました。
(P2) 同社の発表では、「Qwen 3.7は現在のインテリジェント・エージェントのトレンドに合わせて新たに設計され、プログラミングや推論などのコア能力において突破口を開いた」と述べられています。この注力ぶりは、35時間にわたる複雑なエージェント・タスクをモデルが自律的に完了できたことによって実証されました。
(P3) 同モデルのプレビュー版であるQwen3.7-Max-PreviewおよびQwen3.7-Plus-Previewは、LM Arenaベンチマークにおいて、テキスト能力で世界13位、ビジョン能力で16位にランクインし、Kimi-K2.6やDeepSeek-v4-proといった他の中国製モデルを上回りました。主要なデモンストレーションにおいて、アリババはQwen3.7-Maxが自己進化を利用してコアカーネルを書き換えることにより、特定のタスクにおける推論速度を10倍に向上させたと報告しました。
(P4) 今回の発表は世界のAI競争を激化させ、収益性の高いクラウドコンピューティング市場における競合のGoogleやMicrosoftに対するアリババの地位を強化するものです。また、この動きは、中国のAI開発者の間で最も強力なモデルを非公開(プロプライエタリ)に保ち、最先端AIのトレーニングに必要な巨額の計算支出を賄うために有料APIアクセスへと移行するという、より広範なトレンドを強調しています。
アリババは、最新モデルを成長著しいAIエージェント分野(複雑で多段階のタスクを実行できる自律型システム)に向けて展開しています。同社は、Qwen3.7-Maxが新型チッププラットフォーム上で35時間連続稼働したという重要な成果を強調しました。
このプロセスにおいて、モデルは1,000回以上のツール呼び出しを自律的に行い、主要なソフトウェアカーネルを進化させるための自己プログラミングに従事しました。この自己最適化の取り組みにより、特定の機能の推論速度が10倍に向上し、モデルの推論およびコード生成能力の飛躍的な進歩が示されました。
Qwen3.7-Maxのリリースは、前身のQwen3.6シリーズからわずか1ヶ月後に行われ、アリババの開発サイクルの加速を象徴しています。しかし、これは商業化戦略の転換も裏付けています。Qwen3.6の路線を継承し、新たなフラッグシップモデルは非公開のプロプライエタリ形式となります。
トップティアのモデルを完全にオープンソース化する方針から距離を置くこの戦略は、中国の主要なAI研究所の間で一般的になりつつあります。商業化への圧力の高まりと計算コストの増大を背景に、各社は有料のアプリケーション・プログラミング・インターフェース(API)を通じてAI研究を収益化しようとしています。これにより、企業顧客は強力な基盤モデル上でアプリケーションを構築できる一方で、企業側は将来の研究開発資金となる収益源を確保することが可能になります。
本記事は情報提供のみを目的としており、投資勧誘を目的としたものではありません。