- 알리바바가 Qwen3.7-Max를 출시하며 글로벌 Arena 블라인드 벤치마크 테스트에서 중국 모델 중 1위를 차지했습니다.
- 이 모델은 자율 프로그래밍을 통해 복잡한 에이전트 작업에서 10배의 추론 속도 향상을 입증했습니다.
- Qwen3.7-Max의 성능은 OpenAI, Google, Anthropic 등 미국의 주요 모델들에 근접한 수준입니다.

(P1) 알리바바가 차세대 플래그십 모델인 Qwen3.7-Max를 출시하며, OpenAI의 GPT-4 및 Anthropic의 Claude 3와 같은 글로벌 선도 모델에 근접한 성능을 갖춘 중국 최고의 AI 대항마로 자리매김했습니다. 이 모델은 영향력 있는 Arena 글로벌 대규모 모델 블라인드 테스트에서 모든 중국 연구소 중 1위를 차지했습니다.
(P2) "Qwen 3.7은 현재의 지능형 에이전트 트렌드에 맞춰 새롭게 설계되었으며, 프로그래밍 및 추론과 같은 핵심 역량에서 획기적인 발전을 이루었습니다"라고 회사는 발표했습니다. 이러한 집중도는 모델이 복잡한 35시간 에이전트 작업을 자율적으로 완료하는 능력을 통해 입증되었습니다.
(P3) 이 모델의 프리뷰 버전인 Qwen3.7-Max-Preview 및 Qwen3.7-Plus-Preview는 LM Arena 벤치마크에서 텍스트 부문 글로벌 13위, 비전 부문 16위를 기록하며 Kimi-K2.6 및 DeepSeek-v4-pro와 같은 다른 중국 모델들을 앞질렀습니다. 핵심 시연에서 알리바바는 Qwen3.7-Max가 자기 진화를 통해 핵심 커널을 재작성함으로써 특정 작업에서 추론 속도를 10배 향상시켰다고 보고했습니다.
(P4) 이번 출시는 글로벌 AI 경쟁을 심화시키며, 구글 및 마이크로소프트와 같은 경쟁사에 맞서 알리바바의 수익성 높은 클라우드 컴퓨팅 시장 내 입지를 강화합니다. 또한 이번 행보는 가장 강력한 모델을 폐쇄형(Proprietary)으로 유지하고, 최첨단 AI 교육에 필요한 막대한 컴퓨팅 비용을 충당하기 위해 유료 API 접근 방식으로 전환하려는 중국 AI 개발자들의 광범위한 트렌드를 강조합니다.
알리바바는 자사의 최신 모델을 복잡하고 다단계의 작업을 수행할 수 있는 자율 시스템인 AI 에이전트 분야로 향하게 하고 있습니다. 회사는 Qwen3.7-Max가 새로운 칩 플랫폼에서 35시간 동안 연속 작동한 중요한 성과를 강조했습니다.
이 과정에서 모델은 1,000회 이상의 도구 호출을 자율적으로 사용하고 핵심 소프트웨어 커널을 진화시키기 위해 셀프 프로그래밍을 수행했습니다. 이러한 자기 최적화 행위는 해당 특정 기능에 대한 추론 속도를 10배 향상시켰으며, 이는 모델의 추론 및 코드 생성 능력의 비약을 보여줍니다.
Qwen3.7-Max의 출시는 이전 버전인 Qwen3.6 시리즈 이후 불과 한 달 만에 이루어진 것으로, 알리바바의 개발 주기가 가속화되었음을 시사합니다. 그러나 이는 또한 상업화 전략의 변화를 확인시켜 줍니다. Qwen3.6의 경로를 따라 새로운 플래그십 모델은 폐쇄형으로 유지될 것입니다.
최상위 모델의 완전 오픈 소스화를 멀리하는 이러한 전략은 주요 중국 AI 연구소들 사이에서 보편화되고 있습니다. 증가하는 상업화 압력과 높은 컴퓨팅 비용으로 인해 기업들은 유료 응용 프로그램 인터페이스(API)를 통해 AI 연구를 수익화하고자 합니다. 이를 통해 기업 고객은 강력한 파운데이션 모델 위에 애플리케이션을 구축할 수 있으며, 회사는 미래 연구 개발을 위한 자금원을 확보하게 됩니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.