OpenAI, 주력 모델 성능에 근접한 저렴한 AI 모델 출시

GPT-5.4 Mini, 70% 낮은 비용으로 3.3% 성능 격차 축소

3월 17일, OpenAI는 개발자들이 직면한 비용-성능 방정식의 근본적인 변화를 가져올 두 개의 더 작은 인공지능 모델인 GPT-5.4 mini와 nano를 출시했습니다. GPT-5.4 mini 모델은 주력 모델인 GPT-5.4와 거의 대등한 성능을 훨씬 낮은 가격으로 제공합니다. mini의 API 가격은 백만 입력 토큰당 0.75달러, 백만 출력 토큰당 4.50달러로, 주력 모델의 각 요율인 2.50달러와 15.00달러에 비해 70%의 비용 절감을 나타냅니다.

이러한 비용 효율성은 기능의 큰 타협을 수반하지 않습니다. 실제 GitHub 문제를 해결하는 능력을 테스트하는 SWE-bench Pro 벤치마크에서 GPT-5.4 mini는 54.4%의 점수를 달성했으며, 주력 GPT-5.4의 57.7%보다 불과 3.3% 포인트 뒤처졌습니다. OSWorld-Verified 벤치마크로 측정된 컴퓨터 운영 작업에서 mini 모델은 72.1%를 기록했으며, 주력 모델의 75.0%와 거의 일치하고 인간 기준인 72.4%를 약간 초과했습니다.

새로운 모델, AI 워크플로우를 위한 '하위 에이전트' 아키텍처 지원

이번 출시는 강력한 AI가 더 작고 빠른 모델의 코디네이터 역할을 하는 다중 모델 시스템으로의 전략적 전환을 시사합니다. 이 '하위 에이전트' 아키텍처를 통해 개발자는 대용량의 덜 복잡한 작업을 저렴한 모델에 위임하고, 고가의 주력 AI는 고수준 계획 및 추론을 위해 남겨둘 수 있습니다. 예를 들어, OpenAI의 Codex 프로그래밍 도우미 내에서 GPT-5.4는 작업을 조율하고 GPT-5.4 mini 하위 에이전트는 코드 검색 및 파일 검토와 같은 병렬 작업을 약 3분의 1의 비용으로 처리할 수 있습니다.

이 접근 방식은 응답 속도가 사용자 경험에 직접적인 영향을 미치는 지연에 민감한 애플리케이션에 매우 중요합니다. 새로운 모델이 낮은 비용으로 복잡한 도구 호출을 안정적으로 처리할 수 있는 능력은 업계에 있어 중요한 진전입니다.

최근까지 가장 비싼 모델만이 에이전트 도구 호출을 안정적으로 탐색할 수 있었습니다. 오늘날 GPT-5.4 mini 및 nano와 같은 더 작은 모델도 이를 쉽게 처리할 수 있어, Notion 사용자들이 Custom Agents를 구축할 때 필요한 지능의 양을 정확히 선택할 수 있게 될 것입니다.

— Notion AI 엔지니어링 리드 Abhisek Modi.

GPT-5.4 Nano, 백만 토큰당 0.20달러의 고용량 작업 대상

가장 경제적인 옵션으로 자리매김한 GPT-5.4 nano는 OpenAI의 API를 통해서만 제공되며, 백만 입력 토큰당 0.20달러, 백만 출력 토큰당 1.25달러로 책정되었습니다. OpenAI는 이 모델을 데이터 분류, 텍스트 추출, 간단한 코딩 지원과 같은 고빈도, 저복잡성 작업을 위해 특별히 설계했습니다.

nano의 OSWorld-Verified와 같은 시각적 작업 성능은 이전 모델보다 낮지만, 추론 및 도구 사용 벤치마크에서는 이전 소형 모델보다 훨씬 개선된 성능을 보여줍니다. 예를 들어, GPQA Diamond 일반 지능 테스트에서 82.8%의 점수를 기록하여 이전 GPT-5 mini의 81.6%를 능가합니다. nano의 도입은 속도와 예산이 주요 제약인 비용 효율적인 AI 시스템을 구축하기 위한 고도로 전문화된 도구를 개발자에게 제공합니다.