구글이 자사의 맞춤형 AI 실리콘을 처음으로 두 가지 제품군으로 분리했습니다. 이는 단순히 모델을 학습시키는 것에서 벗어나, 컴퓨팅 집약적인 모델 실행(추론) 프로세스로 업계의 흐름이 변화하고 있는 것에 대한 직접적인 대응입니다. 구글 클라우드 넥스트(Cloud Next) 컨퍼런스에서 발표된 새로운 8세대 텐서 프로세싱 유닛(TPU)은 강력한 학습용 칩과 효율적인 별도의 추론용 칩을 포함하고 있으며, 이는 엔비디아(Nvidia Corp.)의 AI 하드웨어 시장 지배력에 도전하는 행보입니다.
구글 클라우드 CEO 토마스 쿠리안(Thomas Kurian)은 기자들에게 "두 개의 새로운 칩을 만들기로 한 결정은 '자연스러운 진화'였다"며, 새 칩들이 전력 효율성을 고려해 설계되었다고 덧붙였습니다. "학습과 추론 규모가 계속 확장됨에 따라 전력 효율성이 제약 요인이 될 것이라고 느꼈습니다."
새로운 라인업은 대규모 AI 모델의 고강도 학습 프로세스를 위해 설계된 TPU 8t와, 답변을 생성하거나 작업을 수행하기 위해 모델을 실행하는 상대적으로 강도가 낮지만 대량인 추론 작업에 최적화된 TPU 8i로 구성됩니다. 구글은 작년의 7세대 아이언우드(Ironwood) TPU보다 크게 도약한 두 칩 모두 올해 말에 정식 출시될 예정이라고 밝혔습니다. 특히 TPU 8i는 고대역폭 메모리(HBM)를 대폭 늘려 에이전틱 AI 애플리케이션의 속도를 늦출 수 있는 '메모리 벽' 문제를 해결했습니다.
이러한 전략적 분리는 인공지능의 다음 주요 물결이 사용자를 대신해 추론하고 계획하며 다단계 작업을 실행할 수 있는 자율형 AI 시스템인 '에이전트'가 될 것이라는 구글의 확신을 보여줍니다. 구글 인프라 책임자인 아민 바다트(Amin Vahadat)와 마크 로메이어(Mark Lohmeyer)는 블로그 게시물에서 "AI는 질문에 답하는 수준에서 추론하고 행동하는 단계로 진화하고 있다"고 말했습니다. 이러한 변화에는 방대한 양의 추론 연산이 필요하며, 이는 엔비디아가 새로운 칩과 라이선스 계약을 통해 공략해 온 시장 세그먼트이기도 합니다.
이러한 에이전틱 전환을 가속화하기 위해 구글은 AI 에이전트를 구축하고 관리하기 위한 통합 시스템인 '제미나이 엔터프라이즈 에이전트 플랫폼(Gemini Enterprise Agent Platform)'을 출시했으며, 액센추어, 딜로이트, 오라클 등 파트너사들이 이러한 솔루션을 구축하고 배포할 수 있도록 돕기 위해 7억 5,000만 달러 규모의 펀드를 새롭게 조성했습니다. 이 플랫폼은 구글 고유의 제미나이 제품군과 구글 클라우드 TPU의 주요 고객인 앤스로픽(Anthropic)과 같은 기업의 타사 모델을 포함해 200개 이상의 AI 모델에 대한 액세스를 제공합니다.
성능이 향상된 인하우스 실리콘을 구축하려는 움직임은 상당한 재무적 영향을 미칠 수 있습니다. 구글 클라우드의 매출은 AI 수요에 힘입어 2025년 4분기에 177억 달러로 48% 급증했습니다. 엔비디아에 대한 의존도를 낮출 수 있는 맞춤형 칩을 개발함으로써 구글은 잠재적으로 비용을 절감하고 마진을 개선할 수 있습니다. 모건스탠리는 12월 보고서에서 50만 개의 TPU 칩을 판매하면 2027년 구글의 재무제표에 약 130억 달러의 매출이 추가될 수 있다고 추정했습니다.
새로운 칩은 에이전트 대응이 가능한 포괄적인 기술 스택을 구축하기 위한 광범위한 발표의 일부입니다. 여기에는 AI 네이티브 데이터 아키텍처인 '에이전틱 데이터 클라우드(Agentic Data Cloud)'와 최근 인수한 위즈(Wiz)와 함께 개발한 새로운 AI 기반 사이버 보안 솔루션이 포함됩니다. 맞춤형 하드웨어부터 에이전트 구축 플랫폼까지 전체 스택을 제어함으로써 구글은 차세대 AI 시대의 기초 인프라 제공업체가 되기 위한 강력한 승부수를 던지고 있습니다.
이 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.