MiniMax, 자체 성능 30% 향상 후 M2.7 모델 오픈 소스화

MiniMax는 자체 개발 주기에 적극적으로 참여하고 개선하는 업계 최초의 에이전트 AI인 M2.7 모델을 오픈 소스로 공개하며, 선도적인 독점 모델과 대등한 성능을 달성했습니다.

MiniMax는 자사에서 가장 유능한 혼합 전문가(MoE) 모델인 MiniMax M2.7을 공식적으로 오픈 소스화하여 Hugging Face에 가중치를 공개했습니다. 자체 개발 과정에 직접 참여하여 30%의 성능 향상을 이룬 이 모델은 SWE-Pro 소프트웨어 엔지니어링 벤치마크에서 56.22%를 기록하며 GPT-5.3-Codex와 어깨를 나란히 했고, 오픈 소스 AI 시장의 새로운 경쟁 국면을 예고했습니다.

회사는 기술 블로그 게시물을 통해 "자율적 개선의 한계를 테스트하기 위해 MiniMax M2.7에 내부 스캐폴드 상에서 모델의 프로그래밍 성능을 최적화하는 작업을 맡겼다"고 밝혔습니다. "이 모델은 100회 이상의 라운드 동안 '실패 궤적 분석 → 변경 계획 → 스캐폴드 코드 수정 → 평가 실행 → 결과 비교 → 변경 유지 또는 복구 결정'의 반복 루프를 완전히 자율적으로 실행했습니다."

이러한 자가 진화 과정은 내부 평가에서 30%의 성능 향상이라는 결과를 낳았습니다. 공개 벤치마크에서 M2.7은 오픈 소스 모델 중 최첨단 성과를 거두었으며, Terminal Bench 2에서 57.0%, VIBE-Pro 레포 레벨 코드 생성 테스트에서 55.6%를 기록하며 Anthropic의 Opus 4.6에 근접했습니다. 이 모델은 Nvidia, Huawei Ascend, Moore Threads를 포함한 하드웨어 제조사들과의 파트너십을 통해 개발되어 폭넓은 초기 호환성을 보장합니다.

이번 출시는 OpenAI나 Anthropic과 같은 기업의 독점 모델과 오픈 소스 모델 간의 성능 격차에 도전장을 내밀었습니다. 자가 개선이 가능하고 복잡한 실무 엔지니어링 작업에서 높은 성능을 보이는 모델을 오픈 소스로 공개함으로써, MiniMax는 기존 업체들에 압박을 가하고 개발자들에게 강력하고 자유롭게 접근 가능한 도구를 제공하여, 기업용 AI 조달 방식이 값비싼 API 기반 시스템에서 벗어날 가능성을 열어주었습니다.

에이전트 업무를 위한 새로운 아키텍처

MiniMax M2.7은 회사의 M2 시리즈 혼합 전문가(MoE) 모델의 일부입니다. 이 아키텍처는 추론 중에 파라미터의 일부만 활성화되므로 밀집 모델보다 효율적이며, 실행 속도가 빠르고 비용이 저렴합니다. 이 모델은 전문 소프트웨어 엔지니어링, 전문 사무 업무, 그리고 MiniMax가 "에이전트 팀"이라고 부르는 네이티브 멀티 에이전트 협업이라는 세 가지 핵심 역량을 중심으로 구축되었습니다. 이러한 기능을 통해 M2.7은 복잡한 기술과 동적 도구 검색을 활용하여 고도로 정교한 생산성 작업을 완료할 수 있습니다.

실제 엔지니어링에서의 탁월함

실제 엔지니어링 과제를 시뮬레이션하는 벤치마크에서의 성능은 이 모델을 더욱 돋보이게 합니다. 로그 분석, 버그 문제 해결, 코드 보안 검토 등의 작업을 다루는 SWE-Pro에서 M2.7의 56.22% 정확도는 GPT-5.3-Codex와 일치합니다. 이는 단순히 코드를 생성하는 것을 넘어 소프트웨어 시스템의 운영 로직을 이해하는 능력을 보여줍니다. MiniMax 팀은 이 역량을 내부적으로 활용하여 실제 운영 시스템 장애 복구 시간을 3분 미만으로 단축했으며, 모델이 자율적으로 관측성 분석, 데이터베이스 쿼리 및 머지 리퀘스트 제출을 수행했다고 보고했습니다.

엔지니어링을 넘어: 전문 사무 및 재무 기술

엔지니어링 역량 외에도 MiniMax M2.7은 전문 사무 업무를 타겟으로 합니다. 45개 모델의 도메인 전문 지식을 측정하는 GDPval-AA 평가에서 M2.7은 ELO 점수 1495를 기록하여 모든 오픈 소스 모델 중 가장 높았으며, Opus 4.6 및 GPT-5.4와 같은 최상위 독점 모델에 이어 2위를 차지했습니다. 재무 분야에서 이 모델은 주니어 분석가 역할을 수행하며 자율적으로 연차 보고서를 읽고, 수익 예측 모델을 구축하며, 연구 보고서를 작성할 수 있습니다. 이러한 폭넓은 기술 세트는 기업 및 전문가용으로 포지셔닝된 모델들과 직접 경쟁하게 만듭니다. 검증된 능력을 갖춘 모델의 오픈 소스화는 다양한 산업 전반에서 에이전트 AI 워크플로우의 도입을 가속화하여, 폐쇄형 시스템에 대한 액세스 판매에 의존하는 기업들의 비즈니스 모델에 영향을 미칠 수 있습니다.

이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.