구글이 더 많은 연산을 활용해 성능을 높이면서 비용을 낮추며 AI 모델을 더 저렴하고 빠르게 만들고 있다.
구글이 더 많은 연산을 활용해 성능을 높이면서 비용을 낮추며 AI 모델을 더 저렴하고 빠르게 만들고 있다.

구글은 더 많은 연산을 사용해 성능을 높이면서 비용을 낮추며 AI 모델을 더 저렴하고 빠르게 만들고 있다. 이는 업계가 가격 인상과 사용량 제한에 대한 비판에 직면한 상황에서 경쟁사 오픈AI(OpenAI)와 앤트로픽(Anthropic)에 압력을 가하는 전략이다.
"연산 규모를 확장함으로써 토큰당 비용을 낮추면서 더 나은 성능을 제공할 수 있습니다,"라고 구글 대변인은 말했다. "이는 맞춤형 TPU 하드웨어와 모델 아키텍처 개선에 대한 투자의 직접적인 결과입니다."
비용 절감은 구글의 AI 모멘텀이 가속화되는 시점에 이루어졌다. 회사는 가장 최근 분기 매출 1100억 달러를 기록하며 전년 동기 대비 22% 증가했고, 클라우드 매출은 63% 급증했다. 알파벳(Alphabet) 주식은 주당 387달러 근처에서 거래되며 연초 대비 25% 상승했고, 54개 애널리스트 컨센서스는 '중립 매수(Moderate Buy)' 의견과 평균 목표주가 412.65달러를 제시하고 있다. 웰스파고(Wells Fargo)는 목표가를 435달러로 상향했으며, 시티즌스 JMP(Citizens JMP)는 업계 최고 수준인 515달러를 유지하고 있다.
시점 또한 전략적이다. 경쟁사 앤트로픽과 오픈AI는 모두 가격 변경에 대한 반발에 직면했다. 앤트로픽은 클로드 코드(Claude Code)의 개발자당 예상 비용을 두 배로 인상했고, 오픈AI는 성능을 약화시킬 것이라는 우려를 불러일으킨 새로운 연산 계층 옵션을 테스트했다. 구글의 자체 제미니(Gemini) 앱은 이번 달 연산 기반 사용량 제한을 도입해 헤비 유저를 최대 5시간 동안 차단했는데, 이는 비판을 불러일으켰지만 동시에 회사가 추론 경제성 관리에 집중하고 있음을 시사했다.
연산 규모 확장이 비용을 낮추는 방법
구글의 우위는 자체적으로 완전히 통제하는 세 가지 계층, 즉 맞춤형 텐서 처리 장치(TPU), 제미니 모델 제품군, 40개 이상의 리전에 걸친 클라우드 인프라에 기반한다. 2026년 구글 I/O에서 구글은 낮은 연산 비용으로 강력한 성능을 제공하도록 설계된 경량 모델인 제미니 3.5 플래시(Gemini 3.5 Flash), 물리적 환경을 시뮬레이션하는 월드 모델인 옴니(Omni), 연결된 앱 전반에서 작동할 수 있는 에이전틱 AI인 제미니 스파크(Gemini Spark)를 공개했다.
경제성은 규모에 유리하다. 팔란티어(Palantir)의 샤얌 상카르(Shyam Sankar) 최고기술책임자는 별도의 맥락에서 "추론 비용이 낮아질수록 AI에 경제적으로 할당할 수 있는 작업의 수가 기하급수적으로 늘어납니다"라고 언급했다. 구글이 수백만 건의 일일 추론에 TPU 개발 비용을 분산할 수 있는 능력은 시장 가격으로 구매한 엔비디아(Nvidia) GPU에 의존하는 경쟁사보다 구조적 비용 우위를 제공한다.
경쟁사와 투자자에 미치는 영향
비용 절감은 구글과 소규모 AI 연구소 간의 격차를 벌릴 위협이 되고 있다. 앤트로픽의 클로드 코드 가격 정책으로 인해 마이크로소프트(Microsoft)는 개발자들이 해당 도구를 선호했음에도 불구하고 내부 라이선스를 철회해야 했다는 보고서가 있다. 오픈AI의 GPT-5.5 인스턴트(Instant)는 이번 달 챗GPT의 기본 모델이 되었지만, 회사는 구글의 가격 인하 속도를 따라잡지 못하고 있다.
투자자들에게 시사점은 두 가지다. 추론 비용 하락은 AI 애플리케이션의 접근 가능 시장을 확장해 구글 클라우드의 엔터프라이즈 파이프라인에 혜택을 준다. 그러나 동시에 구글과 같은 하드웨어 수직 통합이 부족한 AI 네이티브 기업들의 마진을 압박한다. 알파벳의 1740억 달러에 달하는 트레일링 현금 흐름은 이 전략을 가능하게 하는 인프라 구축에 자금을 공급하며, 순수 AI 연구소가 따라잡을 수 없는 해자(moat) 역할을 한다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.