Arrcus와 NVIDIA, 40% 지연 시간 단축 목표
Arrcus는 인공지능 워크로드를 위한 보다 효율적인 패브릭을 구축하기 위해 네트워킹 소프트웨어를 NVIDIA의 하드웨어와 통합하고 있습니다. 2026년 3월 16일 NVIDIA GTC 컨퍼런스에서 발표된 이번 협력은 Arrcus 추론 네트워크 패브릭(AINF)을 Dynamo 프레임워크, BlueField-3 DPU, Spectrum-X 이더넷 네트워킹 플랫폼을 포함한 NVIDIA의 AI 인프라와 결합합니다. 목표는 데이터 센터, 클라우드 환경 및 엣지 위치 전반에 걸쳐 AI 트래픽을 지능적으로 관리할 수 있는 통합된 정책 인식 네트워크를 생성하는 것입니다.
이번 파트너십은 AI 애플리케이션에 상당한 성능 향상을 제공하는 것을 목표로 합니다. Arrcus는 통합 시스템이 엔드투엔드 지연 시간을 40% 줄이고 추론당 비용을 30% 낮출 것으로 예상합니다. 이는 AI 모델이 더욱 널리 보급됨에 따라 발생하는 중요한 병목 현상을 해결합니다.
AI는 추론 시대로 진입하고 있으며, 여기서 네트워킹은 성능과 경제성의 제어 평면이 됩니다.
— Arrcus 회장 겸 CEO Shekar Ayyar.
추론 수요가 새로운 네트워크 아키텍처를 주도
이번 협력은 AI 산업에서 중앙 집중식 모델 훈련에서 전 세계적으로 분산된 추론으로의 근본적인 변화에 대응합니다. 자율 시스템, 실시간 비디오 분석 및 에이전트 AI 워크플로우와 같은 애플리케이션이 더욱 보편화됨에 따라, 전통적인 시스템으로는 충족할 수 없는 새로운 네트워크 인프라 요구 사항을 발생시킵니다. 이러한 워크로드는 초저지연, 지리 인식 데이터 라우팅 및 최대 GPU 활용률을 필요로 합니다.
McKinsey의 예측에 따르면, AI 추론은 2030년까지 데이터 센터 워크로드의 40%를 차지할 수 있습니다. Arrcus는 네트워크의 "정책 인식 AI" 역할을 하여 이러한 복잡성을 관리하기 위해 AINF를 설계했습니다. 이는 운영자가 정의한 지연 시간, 전력 소비 또는 데이터 주권 정책에 따라 트래픽을 지능적으로 라우팅합니다. Arrcus는 이 접근 방식이 응답성의 핵심 지표인 최초 토큰 생성 시간을 최대 60% 단축할 수 있다고 말합니다.
Lightstorm 및 Fujitsu와 함께 생태계를 확장하는 Arrcus
배포를 가속화하기 위해 Arrcus는 전략적 파트너 생태계를 구축하고 있습니다. 연결 제공업체인 Lightstorm는 아시아 태평양 지역 전반에 걸쳐 실시간, 대규모 추론 서비스를 제공하기 위해 AINF 솔루션을 자체 NaaS(Network-as-a-Service) 플랫폼인 Polarin과 통합하여 사용할 것입니다. 이는 아시아의 하이퍼스케일러 및 기업을 위한 명확한 시장 진입 경로를 제공합니다.
하드웨어 공급업체와의 추가 협력은 Arrcus가 기존 네트워킹 제공업체에 대한 분리된 대안을 제공하려는 전략을 공고히 합니다. 이 회사는 Fujitsu와 협력하여 AINF를 새로운 Arm 기반 Monaka AI 추론 프로세서와 페어링하고 있습니다. 화이트박스 공급업체 UfiSpace 및 컴퓨팅 인프라 회사 Lanner와의 추가 파트너십은 Arrcus 소프트웨어를 실행하는 데 사용할 수 있는 AI 최적화 하드웨어 솔루션의 범위를 확장합니다.