DeepSeek의 새로운 V4 모델 시리즈는 추론 비용을 낮추고 100만 토큰 컨텍스트를 지원합니다. 이러한 결합은 기업들이 단순한 챗봇에서 복잡하고 자율적인 AI 에이전트로 전환하는 속도를 높일 수 있습니다.
중국 AI 기업 DeepSeek이 100만 토큰 컨텍스트 창을 지원하면서도 비용을 대폭 절감했다고 주장하는 시스템인 V4 모델 시리즈를 출시하며 미국 경쟁사들에게 도전장을 내밀었습니다. 이번 출시는 백악관이 중국 단체들의 미국 AI 기술 탈취 시도를 비난한 직후에 이루어져 중미 간 AI 경쟁을 더욱 심화시키고 있습니다.
기술 연구 기관 iiMedia의 설립자 장이(Zhang Yi)는 AFP와의 인터뷰에서 "이는 긴 컨텍스트 길이와 관련된 고질적인 성능 저하 및 고비용 문제를 해결하며 업계의 진정한 변곡점을 시사한다"고 말했습니다.
새로운 시리즈는 복잡한 작업을 위한 1.6조 개의 매개변수를 가진 V4-Pro와 보다 경제적인 2,840억 개의 매개변수를 가진 V4-Flash의 두 가지 버전으로 구성됩니다. DeepSeek은 V4-Pro의 '세계 지식' 능력이 구글의 최신 Gemini 모델에 이어 두 번째라고 주장합니다. 또한 이 시스템은 중국 기술 거물 화웨이(Huawei)의 칩에 최적화되었으며, 화웨이의 Ascend SuperPoD 제품이 V4 시리즈를 지원하고 있습니다.
CICC의 보고서에 따르면 효율성 향상은 에이전틱 AI(Agentic AI)에 대한 다운스트림 수요를 가속화할 것으로 예상됩니다. 이 투자 은행은 모델 개발사인 즈푸(Zhipu, 02513.HK)와 MiniMax(00100.HK)를 낙관적으로 평가하며, 이들이 기술 발전과 복잡하고 긴 호흡의 AI 작업 시장 확대의 수혜를 입을 것으로 내다봤습니다.
V4 아키텍처: 긴 컨텍스트 비용 문제 해결 목표
V4 시리즈의 핵심 혁신은 대규모 컨텍스트 창과 관련된 컴퓨팅 및 메모리 비용을 줄이기 위해 설계된 하이브리드 어텐션(hybrid attention) 메커니즘입니다. 단일 토큰 추론 FLOPs와 KV 캐시(KV Cache) 사용을 최적화함으로써, DeepSeek은 100만 토큰 규모의 모델이 주류 애플리케이션에서 상업적으로 실행 가능하도록 만드는 것을 목표로 합니다.
이러한 효율성에 대한 집중은 API 가격 정책에도 반영되어 있습니다. 공개된 요율에 따르면 DeepSeek V4 Pro 모델의 가격은 입력 토큰 100만 개당 1.74달러, 출력 토큰당 3.48달러로 책정되었습니다. 이는 다른 고성능 모델과 비교했을 때 경쟁력 있는 가격입니다. 참고로 최근 출시된 샤오미(Xiaomi)의 MiMo-V2.5-Pro는 입력 1.00달러, 출력 3.00달러이며, 앤스로픽(Anthropic)의 강력한 Claude Opus 4.7은 입력 5.00달러, 출력 25.00달러로 훨씬 더 비쌉니다.
에이전틱 AI와 오픈 소스가 부추기는 경쟁
DeepSeek의 전략은 성장하는 에이전틱 AI 분야에 집중되어 있는 것으로 보입니다. 사측은 자사의 V4 모델이 AI가 사용자를 대신해 복잡한 작업을 자율적으로 수행할 수 있게 해주는 OpenClaw 및 CodeBuddy와 같은 인기 있는 AI 에이전트 프레임워크에 최적화되었다고 밝혔습니다. 이 시장 세그먼트는 샤오미의 MiMo-V2.5-Pro와 같은 모델들이 에이전틱 벤치마크에서 높은 효율성을 입증하며 치열한 경쟁을 벌이고 있습니다.
DeepSeek 전략의 일부에는 OpenAI, 구글, 앤스로픽의 독점 모델과 대조되는 시스템 오픈 소스화가 포함됩니다. 이러한 접근 방식은 중국 지방 정부와 기업들의 채택을 이끌어냈지만 정밀 조사의 대상이 되기도 했습니다. 최근 백악관은 중국 기업들이 "미국 AI를 훔치기 위해 산업적 규모의 증류(distillation) 캠페인을 벌이고 있다"고 비난했으며, 베이징은 이를 "근거 없는 주장"이라고 일축했습니다. 성능 주장 및 국산 하드웨어와의 호환성과 결합된 DeepSeek의 오픈 소스 접근 방식은 자립적인 AI 산업을 구축하려는 중국의 노력에 있어 중요한 이정표가 되었습니다.
이 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.