Tek bir raf bile kurulmadan 50.000 GPU'luk bir kümenin simüle edilmesi, AI altyapısının nasıl inşa edildiği ve bunu kimlerin inşa edebileceği konusunda bir değişime işaret ediyor.
IREN Ltd., yaklaşan 50.000'den fazla NVIDIA Blackwell Ultra GPU dağıtımının ağ mimarisini doğrulamak için BE Networks ile birlikte NVIDIA'nın DSX Air simülasyon platformunu kullanmak üzere ortaklık kurdu. Şirketler Pazartesi günü yaptığı açıklamada, girişimin fiziksel altyapı devreye alınmadan önce IREN'in AI bulut ortamının üretimi temsil eden bir dijital ikizini oluşturduğunu belirtti. Bu sayede şirketler küme davranışını modelleyebilir, ağ topolojilerini doğrulayabilir ve otomasyon iş akışlarını test edebilir - büyük ölçekli AI dağıtımlarında bir darboğaz haline gelen bir sorunu ele alabilir.
"Bu ölçekteki AI bulut altyapısı, aşırı hassasiyet gerektirir," dedi IREN'in baş teknoloji sorumlusu Denis Skrinnikoff. "NVIDIA DSX Air'i BE Networks'ün otomasyon uzmanlığıyla birleştirerek, dağıtım öncesinde kritik tasarım ve operasyonel kararları doğrulayabilir, entegrasyon riskini azaltabilir ve müşteri kapasitesini daha fazla güvenle çevrimiçi hale getirebiliriz."
Simülasyon ortamı, NVIDIA'nın tüm AI fabrikası yığınını kapsıyor - Blackwell Ultra bilgi işlem, Spectrum-X Ethernet dokusu ve NVLink ölçek büyütme ağı - depolama, orkestrasyon ve güvenlik katmanlarının yanında. BE Networks, doğrulanmış tasarımları 0. Gün tasarımı, 1. Gün devreye alma ve 2. Gün operasyonları boyunca tekrarlanabilir iş akışlarına dönüştüren Verity otomasyon platformuyla dağıtımı destekleyecek. NVIDIA ağ bağlantılarından sorumlu kıdemli başkan yardımcısı Gilad Shainer'a göre, bu yaklaşım doğrulama süreçlerini aylardan haftalara indirmeyi hedefliyor.
"AI fabrikaları şimdiye kadar inşa edilmiş en karmaşık sistemler arasında yer alıyor ve simülasyon, bunları hızlı ve büyük ölçekte dağıtmak için vazgeçilmez hale geliyor," dedi Shainer.
DSX platformu ekosistem genelinde genişliyor
Bu dağıtım, NVIDIA'nın 31 Mayıs'ta Taipei'deki GTC'de duyurulan ve açık kaynaklı yazılım kütüphanelerini, referans tasarımları ve ortak teknolojilerini AI fabrikası tasarımı ve operasyonları için birleşik bir çerçevede bir araya getiren DSX platformunu genişletmesiyle gerçekleşiyor. CoreWeave, Crusoe, Firmus, Lambda, Nebius, Nscale ve Yotta Data Services dahil bulut ortakları, riski azaltmak ve GPU kullanımını iyileştirmek için halihazırda DSX bileşenlerini - DSX Sim, DSX MaxLPS ve DSX OS - dağıtıyor.
Donanım tarafında ise Dell Technologies, Hewlett Packard Enterprise, Lenovo ve Supermicro, Tayvan merkezli üreticiler ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron ve Wiwynn'in yanı sıra DSX uyumlu sistemler inşa ediyor. Sistem entegratörleri Quanta Cloud Technology ve Pegatron, Dassault Systèmes ile birlikte raf-tesis tasarımını otomatikleştiren canlı bir AI fabrikası dijital ikiz konfigüratörü oluşturuyor.
Simülasyonun AI altyapı yarışı için anlamı
IREN için, inşa etmeden önce simülasyon yapabilme yeteneği, AI bulut sağlayıcılarının güvenilirliği korurken kapasiteyi daha hızlı çevrimiçi hale getirme baskısıyla karşı karşıya olduğu bir dönemde entegrasyon riskini azaltıyor. Şirketin dikey olarak entegre modeli - Kuzey Amerika, Avrupa ve Asya Pasifik'te yenilenebilir enerji zengini bölgelerde hem veri merkezi altyapısına hem de GPU kümelerine sahip olma - onu AI eğitimi ve çıkarım iş yükleri için daha büyük hiper ölçekleyicilerle rekabet edebilecek bir konuma getiriyor.
Bu yaklaşım aynı zamanda daha küçük bulut sağlayıcılarının hiper ölçek karmaşıklığında dağıtım yapmasının önündeki engeli de düşürüyor. Şirketler, sanal bir ortamda ağ tasarımlarını doğrulayarak, fiziksel dağıtım sırasında sektör genelinde AI fabrikası projelerini geciktiren maliyetli yeniden çalışmalardan kaçınabilir. NVIDIA'dan Shainer, DSX'in kuruluşların altyapı tasarımlarını aylar yerine haftalar içinde doğrulamasına ve yazılımları haftalar yerine günler içinde dağıtmasına olanak tanıdığını söyledi.
Yatırımcılar için bu ortaklık, AI altyapı inşasının agresif bir yörüngede devam ettiğinin sinyalini veriyor. IREN'in 50.000 GPU'luk kümesi, başarıyla devreye alınırsa, CoreWeave ve Lambda tarafından işletilen kümelerle rekabet eden, daha büyük tek konumlu AI süper bilgisayarları arasında yer alacak. Şirket, dağıtımın toplam sermaye harcamasını veya kümenin ne zaman çevrimiçi olacağına dair bir zaman çizelgesini açıklamadı.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.