OpenAI 고객사, 월 1,000억 토큰 소모…AI 비용 급등으로 예산 위기

기업의 AI 지출이 불과 6개월 만에 '사후 고려 사항'에서 '예산 위기'로 변모했다고 OpenAI CEO 샘 올트먼이 인정했다.

인공지능 운영 비용이 기업 고객들에게 "거대한 문제(huge issue)"가 되었다고 OpenAI 최고경영자(CEO) 샘 올트먼이 밝혔다. 토큰 소비량이 불과 6년 전과 비교해 100만 배 급증했기 때문이다.

"6개월 전만 해도 비용은 전혀 언급되지 않았습니다,"라고 올트먼은 6월 2일 OpenAI 엔터프라이즈 행사에서 말했다. "이제는 거대한 문제가 되었습니다." 올트먼 CEO는 현재 OpenAI의 단일 최대 고객이 월 약 1,000억 개의 토큰(약 750억 단어)을 소비한다고 공개했다. 이는 6년 반 전 최대 사용자의 10만 토큰과 비교되는 수치다.

사용량 폭증은 구조적 문제를 드러냈다. OpenAI는 수익 1달러당 1.35달러를 지출하고 있으며, 손실의 주요 원인은 모델 훈련이 아닌 추론 비용이다. 우버 테크놀로지스(Uber Technologies Inc.)는 2026년 전체 AI 예산을 올해 첫 4개월 만에 소진했으며, 이에 따라 엄격한 토큰 상한선을 도입했다. 이 차량 호출 기업의 개별 엔지니어들은 월 150달러에서 2,000달러에 이르는 AI 비용 청구서를 받았다. 아마존닷컴(Amazon.com Inc.)은 통제 불능의 소비를 막기 위해 내부 토큰 리더보드를 폐쇄했다.

2026년 1분기 OpenAI와 앤트로픽(Anthropic)이 토큰 기반 과금으로 전환하면서, 이전에는 불투명했던 비용 항목이 측정 가능한 개별 작업별 비용으로 바뀌었고, 초기 결과는 기업 재무팀에 충격을 주고 있다. 가트너(Gartner)는 2026년 AI 에이전트 소프트웨어 지출이 2,070억 달러에 달해 2025년 대비 139% 증가할 것으로 전망하지만, 이러한 궤적은 기업들이 AI 지출을 계속 확대한다는 가정에 기반한다. 우버의 신호와 기업들이 조용히 토큰 소비를 줄이는 패턴은 이 궤적이 압박을 받고 있음을 시사한다.

토큰 함정(The Token Trap)

비용 위기의 근원은 업계의 가격 구조에 있다. 생성형 AI 시대 대부분 동안 정액제 구독은 무제한 토큰 소비를 흡수하여 특정 작업의 실제 비용을 보이지 않게 만들었다. 앤트로픽과 OpenAI가 2026년 1분기에 기업 고객들을 사용량 기반 과금으로 전환하면서 숨겨진 비용이 갑자기 드러났다. 한 앤트로픽 기업 고객은 지출 한도를 설정하지 않아 단 한 달 만에 5억 달러를 실수로 지출했다.

문제는 두 가지 층위를 가진다. 첫째, 출력 품질은 여전히 예측 불가능하다. 대규모 언어 모델은 환각(hallucination), 루프, 오류를 일으키기 쉬우며, 실패한 모든 실행은 결과와 관계없이 토큰을 소모한다. 둘째, AI 작업 비용을 측정하는 표준 단위가 없다. 동일한 작업이라도 프롬프트, 모델 버전, 컨텍스트 윈도우, 에이전트의 오판 여부에 따라 소모되는 토큰 수가 크게 달라지기 때문이다.

2026년 6월 깃허브 코파일럿(GitHub Copilot)의 토큰 기반 과금 전환은 소매 수준에서 가장 명확한 증거를 제공했다. 프로모션 요금제 사용자들은 소수의 프롬프트에서 월 크레딧의 30%에서 60%를 소진했다고 보고했다. 한 사용자는 코파일럿이 하룻밤 사이에 '최고의 구독'에서 '가장 스트레스 받는 구독'으로 변했다고 말했다.

ROI의 현실(The ROI Reckoning)

우버의 경험은 더 광범위한 과제를 보여준다. 앤드류 맥도날드 최고운영책임자(COO)는 5월 25일 한 컨퍼런스에서 엔지니어의 95%가 월간 AI 도구를 사용함에도 불구하고, 그 토큰 지출과 의미 있는 소비자 대상 제품 개선 사이의 연관성을 찾을 수 없다고 인정했다. "그 연결고리는 아직 존재하지 않습니다,"라고 맥도날드는 말했다.

마이크로소프트(Microsoft Corp.)는 엔지니어당 월 500~2,000달러에 달하는 클로드 코드(Claude Code) 청구서에 직면하여, 직접 클로드 코드 라이선스를 취소하고 엔지니어들을 다시 깃허브 코파일럿으로 돌리기 시작했다.

앤트로픽 CEO 다리오 아모데이(Dario Amodei)는 타이밍 리스크를 명시적으로 인정했다. 2월 인터뷰에서 그는 AI 수익 성장 전망이 단 1년만 빗나가도 "파산하게 된다"고 경고했다. 그는 앤트로픽 자체의 인프라 투자를 언급한 것이었지만, 그 논리는 기업 고객들에게도 적용된다. 토큰 기반 과금이 생산성 향상이 비용을 정당화하지 못한다는 것을 드러낸다면, 기업들은 파산하지는 않겠지만 갱신을 중단할 뿐이다.

투자자들에게 토큰 과금 전환은 AI 업계가 생산한 최초의 진정한 가격 발견 메커니즘이다. 정액제 구독은 편리한 외형을 만들어냈다. 비용은 낮았고, 채택률은 높았으며, 투자수익률(ROI)은 추후 해결할 과제로 남겨졌다. 사용량 기반 과금은 하룻밤 사이에 그 계산법을 바꿔놓았다. AI 투자수익률을 측정하고 입증할 수 있는 기업이 현재의 자본 구조가 유지될지를 결정할 것이다. 그렇지 못한 기업은 가장 먼저 재협상과 재고에 나서게 될 것이다.

AI 훈련 및 추론의 대부분을 구동하는 그래픽처리장치(GPU)를 공급하는 엔비디아(Nvidia Corp.)는 기업 고객들이 보편적으로 지출을 제한할 경우 수요 측면의 충격에 직면할 수 있다. 엔비디아의 데이터센터 매출은 5개 분기 연속 전년 대비 200% 이상 성장했지만, 이러한 성장은 지속적으로 확장되는 토큰 소비를 가정한다. 기업 AI 예산의 지속적인 축소는 그 궤적을 압축할 수 있다.

본 문서는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.