엔비디아, AI 에이전트용 1200억 개 매개변수 모델 공개
엔비디아는 복잡한 AI 시스템의 효율성을 향상시키기 위해 강력한 1200억 개 매개변수 오픈 모델인 Nemotron 3 Super를 출시했습니다. 이 모델은 Mamba, Transformer 및 MoE(Mixture-of-Experts) 라우팅을 결합한 하이브리드 아키텍처를 사용하며, 성능을 극대화하기 위해 추론 중에 120억 개 매개변수만 활성화됩니다. 이 설계는 다중 에이전트 워크플로가 표준 채팅보다 최대 15배 더 많은 토큰을 생성하는 "컨텍스트 폭발" 문제와 모든 하위 작업에 대규모 모델을 실행하는 것과 관련된 "사고 비용" 문제를 직접적으로 해결합니다. 100만 토큰 컨텍스트 창을 통해 이 모델은 까다로운 기업 애플리케이션에서 지속적인 다단계 추론을 처리하도록 구축되었습니다.
새로운 모델, 자율 기업 AI로의 전환 촉진
Nemotron 3 Super의 출시는 대화형 챗봇에서 복잡한 워크플로를 계획하고 실행할 수 있는 자율 AI 에이전트로의 광범위한 산업 전환을 시사합니다. 엔비디아는 소프트웨어 개발, 사이버 보안 분류 및 산업 자동화("물리적 AI")와 같은 분야에서 이러한 전환을 지원하기 위해 자사의 기술을 포지셔닝하고 있습니다. 오픈 가중치, 데이터 세트 및 훈련 레시피와 함께 모델을 출시함으로써 회사는 개발자가 플랫폼을 기반으로 구축하도록 장려하여 하드웨어 생태계를 강화합니다. 이러한 전략은 팔란티어, 델 및 퍼플렉시티와 같은 파트너들이 이미 Nemotron 3 Super를 통합하여 서비스 및 워크플로를 자동화하면서 주목받고 있습니다.
오픈 전략, AI 지적 재산 위험 증대
오픈 모델은 혁신과 하드웨어 수요를 가속화하지만, 모델의 핵심 지능인 가중치를 지적 재산 도용의 고가치 목표로 만듭니다. 모델 가중치가 도난당하면 적대자가 모델 기능을 복제할 수 있으므로 전략적 위험은 상당합니다. 2024년 구글 엔지니어가 중국 기업에 AI 영업 비밀을 훔친 혐의로 기소되면서 이러한 위협이 부각되었습니다. AI 시스템이 핵심 인프라가 됨에 따라, 업계는 가장 민감한 모델 자산을 내부자 위협 및 외부 공격으로부터 보호하기 위해 Anthropic과 같은 연구소에서 사용하는 다자간 검증 제어와 같은 더 강력한 보안 조치를 채택해야 한다는 압력을 받고 있습니다.