추론 비용 급증에 따라 Z Squared, 100MW 규모 AI 용량 목표 설정

Z Squared Inc.는 향후 18개월 동안 100MW 규모의 AI 지원 데이터 센터 용량을 구축할 계획이며, 현재 퍼블릭 클라우드가 지배하고 있는 점점 더 비싸지는 AI 추론 워크로드 시장을 공략합니다. 화요일에 발표된 이번 조치는 디지털 인프라 회사가 토큰 기반의 예측 불가능한 가격 책정 방식 대신 모델 실행을 위한 대안을 찾는 기업들을 유치할 수 있는 위치를 마련해 줍니다.

Z Squared는 성명에서 "회사는 향후 18개월 동안 여러 미국 사이트에 걸쳐 고객 계약이 가능한 100MW 규모의 AI 지원 용량 확보를 목표로 하는 전략의 1단계 목적지를 발표했습니다"라고 밝혔습니다. 프로젝트에 대한 투자 금액은 공개되지 않았습니다.

100MW 규모의 구축은 훈련된 AI 모델을 실행하여 답변을 생성하는 과정인 추론에 특화되어 설계되었으며, 이는 주요 운영 비용이 되었습니다. 델 테크놀로지스(Dell Technologies)의 최근 수치에 따르면, 에이전트형 AI 시스템을 사용하는 단일 개발자가 24시간 동안 10억 개의 토큰을 소비할 수 있으며, 이는 퍼블릭 클라우드에서 약 3,400달러의 비용이 발생합니다.

Z Squared(NASDAQ: ZSQR)는 이러한 높은 비용을 피하기 위해 상당 부분의 AI 워크로드가 전문화된 고정 비용 인프라로 이동할 것이라고 확신하고 있습니다. 이러한 선회는 아마존 웹 서비스(AWS) 및 마이크로소프트 애저(Azure)와 같은 하이퍼스케일러와 경쟁하게 만들며, 시장이 완전히 성숙하기 전에 빠르게 확장되는 AI 인프라 시장의 점유율을 확보하는 것을 목표로 합니다.

AI 추론의 경제학

대안적인 AI 인프라에 대한 추진은 에이전트형 워크플로우의 혹독한 경제성에서 기인합니다. 단순한 챗봇과 달리 자율적으로 실행되고 실패한 작업을 재시도할 수 있는 AI 에이전트는 토큰을 매우 빠른 속도로 소비하므로 퍼블릭 클라우드 청구액은 기업에 상당한 재정적 위험이 됩니다. 예를 들어, 델은 온프레미스 AI 시스템이 순수 클라우드 솔루션에 비해 2년 동안 해당 지출을 최대 87%까지 줄일 수 있다고 추정합니다.

Z Squared의 전략은 이러한 시장 기회에 대한 직접적인 대응입니다. 추론을 위한 전용 용량을 제공함으로써 회사는 예측 가능한 운영 비용 모델을 제공하며, 이는 AI 애플리케이션을 확장하는 기업들에 매력적입니다. 모델이 훈련되고 배포된 후에는 추론이 AI 컴퓨팅 수요의 대부분을 차지하기 때문에 추론에 대한 집중은 매우 중요합니다.

붐비는 인프라 분야

Z Squared는 주요 기술 기업들이 이미 자리를 잡고 있는 경쟁적인 분야에 진입하고 있습니다. 델은 OpenAI의 모델, 구글의 Gemini 1.5 Flash, 팔란티어의 Foundry 플랫폼을 고객 소유의 하드웨어에 직접 배포하기 위한 파트너십을 맺으며 온프레미스 AI의 핵심 유통 채널이 되었습니다.

이로 인해 AI 지원 인프라 시장은 휼렛패커드 엔터프라이즈(HPE) 및 슈퍼마이크로(Supermicro)와 같은 전통적인 하드웨어 공급업체와 하이퍼스케일러들이 격돌하는 전쟁터가 되고 있습니다. 아마존의 AWS와 마이크로소프트의 애저는 기업 워크로드를 자신들의 생태계 내에 유지하기 위해 자체 하이브리드 클라우드 서비스를 확장하고 있습니다. Z Squared의 성공은 100MW 용량을 신속하게 구축하고 대형 클라우드 플랫폼의 통합 서비스보다 비용 예측 가능성을 우선시하는 고객을 확보하는 능력에 달려 있습니다.

본 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.