Key Takeaways:
- Microsoft, AI 토큰 비용 급등으로 Copilot Cowork 무제한 요금제 폐지 및 사용량 기반 과금 전환
- 실리콘 데이터 토큰 지수, 최근 13거래일 중 12일 하락… 업계 전반 가격 압력 시사
- 모델 라우팅(Model Routing) — 작업별 최저가 모델 동적 매칭 — 엔터프라이즈 AI 핵심 과제로 부상
Key Takeaways:

세계에서 두 번째로 가치가 높은 기업 마저도 AI 에이전트의 토큰 비용을 감당할 수 없다는 사실이 드러났다. Microsoft의 엔터프라이즈 Copilot Cowork 제품에 대한 무제한 AI 사용 포기는 중요한 전환점을 의미한다.
Microsoft는 화요일 Copilot Cowork를 사용량 기반 과금 모델로 일반 공급(GA)했다. 이는 지난 3월 미리보기 이후 유지돼 온 무제한 접근 방식을 대체한 것이다. 사용자 컴퓨터가 꺼져 있어도 Microsoft 365 문서 전반에서 독립적으로 다단계 작업을 실행할 수 있는 이 AI 에이전트는 이제 크레딧당 과금 방식으로 전환됐으며, 종량제(Pay-as-you-go) 플랜에서 각 크레딧은 $0.01(약 13원)에 책정됐다. 대규모 기업의 경우 사용자당 월 $30(약 39,000원)의 Microsoft 365 Copilot 라이선스는 여전히 필수다.
"일부 사용자는 주당 수백 개의 작업을 완료하는데, 이는 생산성 측면에서 뛰어나지만 비용이 매우 빠르게 증가할 수 있습니다"라고 Charles Lamanna Microsoft Copilot 총괄 부사장이 말했다.
이번 가격 정책 변경과 동시에 Microsoft가 현재 Copilot Cowork를 구동하는 Anthropic 및 OpenAI 모델의 저비용 대안으로 DeepSeek V4 오픈소스 모델의 자체 호스팅 버전을 평가 중이라는 보도가 나왔다(Axios 보도). 고객은 이미 Anthropic의 Opus 4.8과 Sonnet 4.6 중 선택할 수 있으며, Frontier 프로그램에 참여한 기업은 OpenAI의 GPT 5.5와 Microsoft 자체 Cowork 1 모델에 접근할 수 있다. DeepSeek V4가 추가되면 Microsoft는 호스팅된 오픈소스 옵션을 확보하게 되어 작업당 토큰 비용을 획기적으로 낮출 수 있으며, Axios는 이 소식이 수 주 내에 발표될 수 있다고 전했다.
이러한 비용 압박은 Microsoft만의 문제가 아니다. 주요 AI 제공업체들의 토큰 가격을 추적하는 실리콘 데이터 토큰 지수(Silicon Data Token Index)는 최근 13거래일 중 12일 하락하며 단기 저점에 근접했다. 제공업체 간 가격 경쟁이 심화되고 기업들이 증가하는 비용 청구서에 반발하고 있기 때문이다. Mason Daugherty 엔터프라이즈 AI 컨설턴트는 지난 두 달 동안 거의 모든 고객과의 대화에서 조직 전체의 토큰 지출이 최우선 과제로 떠올랐다고 밝혔다. 그는 향후 6~12개월 동안 기업 연간 계약 갱신 시즌이 도래하고 기업 재무팀이 프론티어 모델의 프리미엄 가격 정당성에 의문을 제기하면서 "토큰 경제학(Token Economics)"이 AI 조달 논의의 지배적 테마가 될 것이라고 전망했다.
아키텍처 우위(Advantage)로의 전환
경쟁의 장이 모델 지능에서 비용 효율적 라우팅(routing)으로 이동하고 있다. Arvind Jain 엔터프라이즈 AI 플랫폼 Glean 최고경영자는 기업 AI의 주요 병목이 더 이상 모델 역량이 아니라 "토큰 출력 효율성(Token Output Efficiency)" — 소비된 각 토큰이 얼마나 유용한 작업을 생산하는지 — 라고 말했다. 그는 대부분의 AI 비용은 프롬프트 자체가 아니라 주변 인프라(검색, 툴 호출, 메모리 관리, 다단계 추론)에서 발생한다고 지적했다. 단순한 11단어 요청도 시스템이 컨텍스트를 수집하고 작업을 순차적으로 처리하는 과정에서 수천 개의 토큰으로 불어날 수 있다.
"프론티어 인텔리전스는 점점 풍부해지고 있지만, 효율적인 실행은 그렇지 않습니다"라고 Jain은 말했다. "진정한 경쟁 우위는 각 작업에 적합한 모델과 추론 깊이를 매칭하는 아키텍처 — 강력한 라우팅, 비용 통제, 거버넌스를 갖춘 시스템 — 에서 나옵니다."
이 진단은 Microsoft의 전략과 일치한다. Microsoft는 단순히 더 저렴한 모델로 교체하는 대신, 작업을 가장 비용 효율적인 옵션에 동적으로 할당할 수 있는 모델 라우팅 메커니즘을 구축하고 있다. Anthropic은 복잡한 추론에, DeepSeek나 자체 모델은 단순한 질의에 사용하는 방식이다. 청구 시스템은 이미 모델 사용, 컨텍스트 검색, 툴 호출, 런타임의 네 가지 구성요소로 비용을 세분화해 IT 관리자에게 지출이 어디서 누적되는지 세부적으로 파악할 수 있도록 하고 있다.
Nadella의 프레임워크: 토큰 자본 vs. 인적 자본
Satya Nadella Microsoft 최고경영자는 최근 이러한 변화를 맥락화하는 광범위한 프레임워크를 제시했다. 모든 기업은 '인적 자본'(인력의 지식, 관계, 판단력)과 함께 '토큰 자본'(자체 AI 시스템 및 역량)을 구축해야 한다는 것이다. 그는 토큰 자본이 성장해도 인적 자본은 감가상각되지 않는다고 주장했다. "인간의 방향성 없이는 단순히 컴퓨팅을 제자리에서 돌리는 것에 불과합니다"라고 Nadella는 말했다.
Nadella는 엔터프라이즈 AI 전략의 진정한 시험대는 기업이 축적한 독점적 지식과 역량을 잃지 않으면서 기본 파운데이션 모델을 교체할 수 있는지 여부라고 말했다. "그것이 다가오는 시대에 통제권과 주권을 유지할 수 있는지에 대한 핵심 시험입니다"라고 그는 강조했다.
이 경고에는 내재된 긴장감이 담겨 있다. Nadella는 소수의 지배적인 모델에 모든 가치가 집중되는 것을 경계해야 한다고 경고했으며, 이를 세계화가 산업 경제를 공동화시킨 방식에 비유했다. 그러나 동시에 그의 회사는 OpenAI 및 Anthropic과의 관계를 심화시키면서 중국 오픈소스 대안을 모색하는 균형 잡기를 수행하고 있다 — 이는 모든 엔터프라이즈 AI 구매자가 직면한 비용 압박을 반영한다.
투자자들에게 시사점은 명확하다. 기업들이 더 저렴한 대안을 요구함에 따라 OpenAI, Anthropic 같은 프리미엄 API 제공업체들은 마진 압박에 직면하는 반면, DeepSeek 같은 오픈소스 모델 호스팅 업체는 조달 영역에서 입지를 넓히고 있다. 사용자와 모델 사이에 위치하는 미들웨어, 즉 모델 라우팅 및 비용 최적화 인프라를 구축하는 기업들은 토큰 경제학이 핵심 조달 기준으로 자리잡음에 따라 불균형적인 가치를 포착할 수 있다. Microsoft 주식은 선행 주가수익비율(PER) 약 30배에 거래되고 있다. Copilot Cowork 전환은 DeepSeek V4가 채택될 경우 연간 수억 달러의 추론 비용을 절감할 수 있지만, 동시에 업계 전반의 엔터프라이즈 AI 마진이 대다수 모델의 가격 결정력을 감당할 수 있는 속도보다 더 빠르게 압축되고 있음을 시사한다.
본 글은 정보 제공 목적이며 투자 조언을 구성하지 않습니다.