(P1) 알리바바 그룹 홀딩스(09988.HK)는 자사 모델이 중국 내 가장 강력한 코딩 AI라고 주장하는 차세대 대규모 언어 모델인 Qwen3.6-Plus를 출시했습니다. 이는 국내 경쟁사 및 글로벌 AI 리더들과의 경쟁에서 우위를 점하기 위한 포석입니다.
(P2) 알리바바는 공식 발표를 통해 이 모델이 멀티모달 에이전트 코딩 분야에서 새로운 돌파구를 마련했으며, 이른바 '바이브 코딩(vibe coding)'이라 불리는 단 한 문장의 지시만으로 AI가 코드를 생성할 수 있게 되었다고 밝혔습니다.
(P3) 회사는 SWE-bench 시리즈 및 Claw-Eval과 같은 실제 에이전트 작업이 포함된 권위 있는 평가에서 Qwen 3.6이 매개변수 규모가 2~3배 큰 GLM-5 및 Kimi-K2.5와 같은 모델을 능가했다고 설명했습니다. 또한 이 모델의 성능이 Claude 시리즈의 글로벌 선도 코딩 모델들에 근접하고 있다고 덧붙였습니다.
(P4) Qwen3.6-Plus의 출시는 특히 개발자 도구 및 AI 기반 소프트웨어 개발 시장에서 알리바바의 경쟁력을 크게 강화할 수 있습니다. 이는 자사 클라우드 플랫폼으로 더 많은 사용자를 유치하고 텐센트, 바이두와 같은 국내 경쟁사들에게 압박을 가할 것으로 보입니다.
Qwen 3.6의 벤치마크 성능
알리바바가 제공한 세부 정보에 따르면, Qwen 3.6 모델의 강점은 효율성과 고급 에이전트 능력에 있습니다. 이 모델은 주요 벤치마크에서 중국 경쟁사인 Zhipu AI(GLM) 및 Moonshot AI(Kimi)의 대규모 모델들을 능가한 것으로 보고되었습니다. 이러한 테스트는 자율적인 문제 해결이 필요한 복잡한 리포지토리 수준의 코딩 작업을 처리하는 모델의 능력을 평가합니다.
이 모델은 작업을 자율적으로 분해하고 실행 경로를 계획한 다음, 작업이 완료될 때까지 자체 코드 출력을 테스트하고 수정할 수 있습니다. 이러한 '에이전트' 행동은 AI가 단순한 비서에서 개발 워크플로우의 적극적인 참여자로 진화하고 있음을 보여주는 핵심 요소입니다. 알리바바는 Anthropic의 Claude 시리즈에 필적하는 성능을 주장하고 있으나, 구체적인 테스트 조건이나 직접적인 비교 점수는 공개하지 않았습니다.
AI 클라우드 시장에 미치는 영향
알리바바에게 있어 최고 수준의 코딩 모델은 클라우드 부문의 핵심 자산입니다. 강력한 네이티브 AI 코딩 어시스턴트를 제공함으로써 개발자와 기업 고객이 플랫폼에 더 오래 머물 수 있는 생태계를 구축할 수 있습니다. 우수한 모델은 고객의 개발 비용과 기간을 단축시켜 다른 제공업체에 비해 알리바바 클라우드를 더 매력적인 옵션으로 만듭니다.
이번 행보는 중국 내 AI 가격 및 성능 경쟁을 심화시킵니다. 현지 기술 거물들이 최첨단 성능을 달성하기 위해 경주함에 따라, 주요 격전지는 기초적인 능력에서 코딩 및 에이전트 작업 실행과 같은 전문화된 고부가가치 기술로 이동하고 있습니다. 이 분야에서의 성공은 차세대 기업용 AI 지출을 선점하는 데 매우 중요합니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.