한 인공지능(AI) 인프라 스타트업의 대규모 초기 투자 유치는 시장의 관심이 모델 학습을 위한 막대한 비용 투입에서 모델 실행의 경제성으로 이동하고 있음을 시사합니다. 지난 5월 20일, AI 인프라 제공업체 치징 테크놀로지(Qijing Technology)는 스타링크 캐피털(StarLink Capital)과 화쿵 테크놀로지가 공동 주도하고 기존 주주인 힐하우스 캐피털(Hillhouse Capital)이 참여한 수억 위안 규모의 Pre-A 라운드 투자를 마무리했다고 발표했습니다.
벤처 투자 시장이 경색된 상황에서 이루어진 이번 대규모 자금 조달은 투자자들의 관심이 '거거익선' 식의 모델 경쟁에서 상용 배포라는 실질적인 과제로 옮겨가고 있음을 보여줍니다. 현재 시장은 추론으로 알려진 대규모 AI 모델 사용 과정에서 발생하는 높고 종종 비효율적인 비용 문제를 해결할 수 있는 기업에 주목하고 있습니다.
치징의 핵심 이론은 업계가 MaaS(Model-as-a-Service)에 집중하는 것이 잘못되었다는 것입니다. 대신 이 회사는 AI 출력 단위를 비용과 직접 연결하는 TaaS(Token-as-a-Service)를 제공합니다. 이 회사는 AI 배포의 치명적인 비효율성인 하드웨어 활용도 문제를 정조준합니다. 기존의 추론 방식은 값비싼 GPU 메모리에 크게 의존하여 시스템의 CPU와 표준 RAM을 유휴 상태로 두는 경우가 많으며, 전체 하드웨어 활용도는 20% 미만인 경우가 많습니다. 치징의 '리우허(Liuhe)' 아키텍처와 '위에빙(Yuebing)' 기술은 AI 처리의 핵심 구성 요소인 KV 캐시 관리 방식을 재설계하여 값비싼 GPU에 대한 의존도를 낮추는 것을 목표로 합니다. 이 회사는 이미 즈푸(Zhipu)의 GLM과 같은 주요 모델에 추론 서비스를 제공하며 매일 거의 1조 개의 토큰을 처리하고 있습니다.
이러한 효율성에 대한 강조는 AI 산업이 확장에 따른 숨겨진 비용 문제에 직면하면서 나타났습니다. 수조 개의 파라미터로 학습된 거대언어모델(LLM)은 강력하지만 실행 비용이 많이 들고 많은 작업에서 비효율적일 수 있습니다. 일부 기업들은 특정 애플리케이션의 경우 더 작고 컴팩트한 모델이 대형 모델보다 5~10배 빠르게 반응하면서 성능과 비용의 더 나은 균형을 제공할 수 있다는 점을 발견하고 있습니다. 이는 초기 모델 비용을 넘어 유지 관리, 모니터링, 에너지 소비를 포함한 총 소유 비용(TCO)을 최적화할 수 있는 인프라 제공업체에게 확실한 상업적 기회를 제공합니다.
새로운 경쟁 격전지
컴퓨팅 파워의 수급 불균형은 추론 최적화의 필요성을 더욱 심화시키고 있습니다. 2026년 3월, 텐센트 클라우드, 알리바바 클라우드, 바이두 스마트 클라우드 등 주요 제공업체들이 AI 컴퓨팅 서비스 가격을 인상했으며, 일부 모델 비용은 460% 이상 상승했습니다. 이러한 환경은 치징과 같은 전문 기업들에게 중요한 기회를 제공합니다.
그러나 이 회사는 치열한 경쟁에 직면해 있습니다. AI 인프라 분야에는 실리콘 플로우(Silicon Flow), 모어댄에이아이(MoreThanAI)와 같은 다른 벤처 스타트업뿐만 아니라 막강한 클라우드 기존 강자들도 포진해 있습니다. 알리바바 클라우드, 화웨이 클라우드, 바이트댄스의 볼케이노 엔진과 같은 기술 거물들은 모두 자체적인 풀스택 AI 인프라 역량을 구축하고 있습니다. 성공을 위해 치징은 유치한 자금을 바탕으로 충분히 깊은 기술적 해자를 구축하고, 거대 기업들이 격차를 좁히거나 대중 시장에 적합한 '적당한' 번들 서비스를 제공하기 전에 고객 충성도를 확보해야 합니다. 이 회사의 성공은 빠르게 진화하는 산업에서 기술적 우위를 지속적인 상업적 성장으로 전환할 수 있는 능력에 달려 있습니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.