전 알리바바 AI 책임자, 큐웬 비판하며 '에이전트적 사고'로의 전환 예고

전 큐웬 책임자, "우리가 모든 것을 제대로 하지 못했다"고 인정

알리바바를 떠난 후 첫 공식 성명에서 전 큐웬 AI 책임자 린쥔양은 팀의 과거 기술 방향에 대해 솔직한 비판을 내놓았다. 그는 "우리가 모든 것을 제대로 하지 못했다"고 공개적으로 인정했으며, 특히 "사고"와 "지시" 모드를 단일 모델로 통합하려 한 야심찬 시도를 지적했다. 이 전략은 큐웬3 모델에서 가장 두드러지게 시도되었다.

린쥔양은 하이브리드 접근 방식이 절충된 시스템을 만들었다고 설명했다. "사고" 기능은 장황하고 주저하게 되었고, "지시" 기능은 직관성과 신뢰성을 잃어 궁극적으로 비용이 더 많이 들게 되었다. 이 평가는 알리바바가 2025년 하반기에 독립적인 "지시" 및 "사고" 모델을 출시한 2507 버전 업데이트를 통해 후속 조치를 취했다는 사실로 뒷받침된다. 린쥔양은 이 두 모드를 결합하는 것이 개념적으로는 타당해 보이지만, 서로 다른 데이터 요구사항과 행동 목표를 조화시키는 실질적인 어려움 때문에 분리하는 것이 상업적 배포를 위한 더 매력적이고 효과적인 경로가 되었다고 주장한다.

"에이전트적 사고", AI의 다음 진화로 주목받다

린쥔양은 OpenAI의 o1 및 DeepSeek-R1과 같은 모델로 대표되는 "추론적 사고" 시대가 대체로 그 임무를 완수했다고 본다. 이 모델들은 복잡한 추론이 훈련되고 확장될 수 있음을 증명했다. 그는 이제 중요한 질문은 다음에 무엇이 올 것인가라고 제시한다. 그의 대답은 "에이전트적 사고"로의 근본적인 전환, 즉 단순히 "더 오래 생각하는 것"에서 "행동하기 위해 생각하는 것"으로의 이동이다.

이 새로운 패러다임은 환경과의 폐쇄 루프에서 작동할 수 있는 AI 에이전트를 훈련하는 데 중점을 둔다. 에이전트적 사고의 주요 특징으로는 언제 사고를 멈추고 행동할지 결정하는 능력, 도구를 선택하고 순서를 정하는 능력, 실제 세계의 노이즈가 많은 피드백을 처리하는 능력, 그리고 실패 후 계획을 수정하는 능력이 포함된다. 이는 최종적인 정적 답변을 생성하는 것에서 벗어나 동적인 환경 내에서 효과적이고 지속적인 행동을 유지하는 데 초점을 맞춘다. 목표는 더 이상 단순히 올바른 답변이 아니라 상호작용을 통한 견고하고 효율적인 문제 해결이다.

더 넓은 시장에서 "행동하기 위해 생각하는 것"을 수용하다

린쥔양의 비전은 AI의 가치가 실제 유용성에 따라 측정되는 더 넓은 시장 추세와 일치한다. 이 개념은 Globeholder AI와 같은 스타트업이 "사고 연구소"를 설립하는 것에서 볼 수 있듯이 상업적 관심을 얻고 있다. 이 회사는 목표 지향적 추론에 대한 린쥔양의 설명과 직접적으로 일치하는 "유형 2 지능"이라는 접근 방식을 정의한다. 이는 구조화된 분석 및 가설 테스트가 가능한 시스템이다.

이러한 전략적 진화는 알리바바의 큐웬과 DeepSeek을 포함한 중국 오픈소스 모델들이 ChatGPT와 같은 서구 독점 시스템의 지배력에 빠르게 도전하면서 전개되고 있다. 2026년 3월 의회 보고서에 따르면, 중국 모델은 전 세계 다운로드 및 사용량에서 점유율을 늘리고 있다. 중국에서 가장 성공적인 오픈소스 프로젝트 중 하나를 이끌었던 핵심 인물인 린쥔양이 새로운 AI 프레임워크를 옹호하는 것은 개발자들이 더 실용적이고 강력한 애플리케이션을 구축하는 방법에 대한 전략적 로드맵을 제공하며, 인공지능의 미래를 정의하기 위한 글로벌 경쟁을 심화시키고 있다.