IREN, NVIDIA DSX 시뮬레이션으로 Blackwell Ultra GPU 5만 대 배치

단 하나의 랙도 설치되기 전에 5만 대 GPU 클러스터를 시뮬레이션하는 것은 AI 인프라가 어떻게 구축되는지, 그리고 누가 이를 구축할 수 있는지에 대한 변화를 의미한다.

IREN Ltd.는 BE Networks와 협력해 NVIDIA의 DSX Air 시뮬레이션 플랫폼을 사용해 50,000개 이상의 NVIDIA Blackwell Ultra GPU 배치를 위한 네트워크 아키텍처를 검증할 예정이라고 두 회사가 월요일 밝혔다. 이 이니셔티브는 물리적 인프라가 배치되기 전에 IREN의 AI 클라우드 환경에 대한 프로덕션 수준의 디지털 트윈을 생성해 클러스터 동작을 모델링하고, 네트워크 토폴로지를 검증하며, 자동화 워크플로우를 테스트할 수 있게 해준다. 이는 대규모 AI 배치에서 병목 현상으로 부상한 문제를 해결하는 것이다.

"이러한 규모의 AI 클라우드 인프라는 극도의 정밀성을 요구합니다."라고 IREN의 최고기술책임자 데니스 스크리니코프가 말했다. "NVIDIA DSX Air와 BE Networks의 자동화 전문성을 결합함으로써 배치 전에 중요한 설계 및 운영 결정을 검증하고, 통합 리스크를 줄이며, 더 큰 확신을 가지고 고객 용량을 온라인으로 전환할 수 있습니다."

시뮬레이션 환경은 NVIDIA의 전체 AI 팩토리 스택(Blackwell Ultra 컴퓨팅, Spectrum-X 이더넷 패브릭, NVLink 스케일업 네트워킹)과 스토리지, 오케스트레이션, 보안 계층을 포괄한다. BE Networks는 자체 Verity 자동화 플랫폼으로 이 롤아웃을 지원하며, 검증된 설계를 Day 0 설계, Day 1 턴업, Day 2 운영에 걸쳐 반복 가능한 워크플로우로 변환한다. 이 접근법은 검증 기간을 수개월에서 수주로 단축하는 것을 목표로 한다고 NVIDIA의 네트워킹 담당 수석 부사장 길라드 샤이너가 전했다.

"AI 팩토리는 지금까지 구축된 시스템 중 가장 복잡한 시스템 중 하나이며, 시뮬레이션은 이를 빠르고 대규모로 배치하는 데 필수적이 되고 있습니다."라고 샤이너는 말했다.

DSX 플랫폼, 생태계 전반으로 확장

이번 배치는 NVIDIA가 5월 31일 GTC 타이베이에서 발표한 DSX 플랫폼의 확장에 따른 것이다. DSX는 오픈소스 소프트웨어 라이브러리, 레퍼런스 설계 및 파트너 기술을 AI 팩토리 설계 및 운영을 위한 통합 프레임워크로 묶은 것이다. CoreWeave, Crusoe, Firmus, Lambda, Nebius, Nscale, Yotta Data Services를 포함한 클라우드 파트너들이 이미 DSX 구성 요소(DSX Sim, DSX MaxLPS, DSX OS)를 배치해 리스크를 줄이고 GPU 활용률을 개선하고 있다.

하드웨어 측면에서는 Dell Technologies, Hewlett Packard Enterprise, Lenovo, Supermicro가 대만 기반 제조사인 ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron, Wiwynn과 함께 DSX 지원 시스템을 구축하고 있다. 시스템 통합업체인 Quanta Cloud Technology와 Pegatron은 Dassault Systèmes와 협력해 랙에서 시설 설계까지 자동화하는 라이브 AI 팩토리 디지털 트윈 구성기를 만들고 있다.

AI 인프라 경쟁에서 시뮬레이션이 의미하는 것

IREN에게 구축 전 시뮬레이션 능력은 AI 클라우드 제공업체들이 안정성을 유지하면서 더 빠르게 용량을 온라인으로 전환해야 하는 압박을 받는 시점에서 통합 리스크를 줄여준다. 북미, 유럽, 아시아 태평양의 재생에너지 풍부 지역에 데이터센터 인프라와 GPU 클러스터를 모두 보유한 회사의 수직통합 모델은 AI 훈련 및 추론 워크로드에서 대형 하이퍼스케일러와 경쟁할 수 있는 위치에 있다.

이 접근법은 또한 소규모 클라우드 제공업체가 하이퍼스케일 수준의 복잡성을 배치할 수 있는 진입장벽을 낮춘다. 가상 환경에서 네트워크 설계를 검증함으로써 기업들은 물리적 배치 중 발생하는 값비싼 재작업을 피할 수 있다. 이러한 리스크는 업계 전반에서 AI 팩토리 프로젝트를 지연시켜 왔다. NVIDIA의 샤이너는 DSX가 조직이 인프라 설계를 수개월 대신 수주 만에 검증하고, 소프트웨어를 수주 대신 수일 내에 배치할 수 있게 해준다고 말했다.

투자자들에게 이번 파트너십은 AI 인프라 구축이 여전히 공격적인 궤도에 있음을 시사한다. IREN의 5만 대 GPU 클러스터는 성공적으로 배치될 경우 CoreWeave와 Lambda가 운영하는 클러스터와 경쟁하는 대규모 단일 사이트 AI 슈퍼컴퓨터 중 하나가 될 것이다. 회사는 이 배치에 필요한 총 자본 지출이나 클러스터 가동 시점에 대해 공개하지 않았다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.