GPT-5.3-Codex 77.3% 기록, 경쟁사 모델 압도
OpenAI는 경쟁사 Anthropic과의 직접적인 대결에 불을 지피며, 목요일 Anthropic이 플래그십 업데이트인 Claude Opus 4.6을 발표하는 정확한 시점에 새로운 프로그래밍 모델 GPT-5.3-Codex를 출시했다. 이 동시 출시는 기업 AI 소프트웨어 시장을 둘러싼 경쟁의 중대한 격화를 의미한다. OpenAI는 자사의 새 모델이 프로그래밍 에이전트의 필수 터미널 운영 기술을 측정하는 Terminal-Bench 2.0 벤치마크에서 77.3%의 점수를 달성하며 큰 도약을 이루었다고 주장한다. 이는 이전 버전보다 13%포인트 향상된 수치이며, Anthropic의 Opus 4.6이 보고한 65.4%를 크게 앞선다.
벤치마크 외에도 OpenAI는 상당한 효율성 향상을 강조하며, 새 모델이 이전 버전 토큰의 절반 미만을 필요로 하면서 추론 속도를 25% 이상 높였다고 밝혔다. 업계의 이정표로서, 이 회사는 또한 GPT-5.3-Codex의 초기 버전이 자체 개발, 디버깅 및 배포에 사용되었다고 공개했다. OpenAI CEO 샘 알트만은 "우리가 5.3-Codex를 사용하여 5.3-Codex를 구축하는 것을 지켜보는 것은 미래에 대한 강력한 통찰력을 제공했다"고 언급했다.
기업 AI 지출, 기업당 1,160만 달러에 달할 전망…OpenAI의 선두 격차 축소
기술 군비 경쟁은 기업 AI 지출의 폭발적인 증가에 의해 가속화되고 있다. Andreessen Horowitz의 조사에 따르면, 대규모 언어 모델에 대한 평균 기업 지출은 2025년에 700만 달러에 달할 예정이며, 이는 2024년 250만 달러에서 180% 증가한 수치이다. 이 수치는 2026년까지 65% 더 증가하여 1,160만 달러에 이를 것으로 예상된다. 이처럼 빠르게 확대되는 시장은 시장 점유율 경쟁을 심화시키고 있다.
동일한 데이터는 변화하는 시장 상황을 보여준다. OpenAI가 여전히 지배적인 플레이어이지만, 기업 AI 지출에서 차지하는 비중은 2024년 62%에서 2026년 53%로 줄어들 것으로 전망된다. 같은 기간 동안 Anthropic의 시장 점유율은 14%에서 18%로 증가할 것으로 예상되며, Google 또한 시장에서 더 큰 비중을 차지할 것이다. 이러한 경쟁 압력은 최근 알트만과 Anthropic이 광고 전략을 놓고 다투는 등 점점 더 공개되는 경쟁 관계를 설명하는 데 도움이 된다.
OpenAI, Codex를 코더에서 범용 에이전트로 확장
OpenAI는 Codex를 전문 프로그래밍 보조자에서 광범위한 지식 작업을 처리할 수 있는 다용도 에이전트로 전략적으로 재배치하고 있다. 이 회사는 이 모델이 이제 디버깅 및 배포에서부터 사용자 연구 및 스프레드시트 데이터 분석에 이르는 작업을 관리할 수 있으며, 이는 Microsoft 및 Salesforce와 같은 기업이 지배하는 더 넓은 기업 생산성 소프트웨어 시장에 직접적인 도전장을 내민 것을 의미한다고 밝혔다.
자사 입지를 강화하기 위해 OpenAI는 GPT-5.3-Codex를 사이버 보안 분야에서 "고성능"을 발휘하는 최초의 모델로 지정했으며, 소프트웨어 취약점을 식별하도록 특별히 훈련되었다. 채택 및 방어 역량을 가속화하기 위해 알트만은 사이버 보안 연구원들에게 1,000만 달러의 API 크레딧을 약속한다고 발표했다.
이것은 건설자들의 시대이며, 그들을 통제하려는 사람들의 시대가 아니다.
— 샘 알트만, OpenAI CEO