NVIDIA'nın Rubin mimarisi, sektördeki %100 sıvı soğutmalı ilk AI platformu olarak 45°C soğutucu sıvı kullanarak fanları ortadan kaldırıyor ve veri merkezi su tüketimini %100'e varan oranda azaltıyor.
NVIDIA'nın Rubin nesli, sıcak bir küvetten daha sıcak olan 45°C'ye kadar soğutucu sıvıyı sızdırmaz, fansız bir tasarımda dolaştırarak veri merkezi soğutma su tüketimini sıfıra yakın seviyeye indiriyor. Bu, soğutmanın elektrik kullanımının %40'ına kadarını oluşturduğu bir sektör için bir dönüm noktası niteliğinde.
"Kuru soğutucu tabanlı tasarımlarda, buharlaştırmalı su soğutması olmayan kapalı döngü bir sistemdir - belki yılın %1'inde bazı iklimlerde soğutma gruplarına ihtiyaç duyabileceğimiz durumlar hariç," dedi NVIDIA'nın veri merkezi soğutma direktörü Ali Heydari.
Sistem, her işlemci, ağ çipi ve güç bileşenine doğrudan monte edilen soğuk plakalar aracılığıyla %75 su ve %25 propilen glikol karışımını dolaştırıyor - önceki nesillerin hibrit hava-sıvı yaklaşımını ortadan kaldırıyor. Soğutucu sıvı rafa 45°C'de giriyor ve çip yüzeyindeki ısıyı emdikten sonra yaklaşık 55°C'de çıkıyor. NVIDIA'ya göre, teknolojiyi benimseyen 50 megavatlık bir hiper ölçekli tesis, soğutmayla ilgili enerji ve su maliyetlerinde yıllık 4 milyon doların üzerinde tasarruf sağlayabilir ve PUE'yi 1,35'ten 1,15'e düşürebilir.
72 GPU ve 36 CPU'yu entegre eden ve kabin başına 100 kW'ı aşan güç yoğunluklarına sahip Rubin NVL72 raflarının her biri 8,8 milyon dolara kadar fiyatlandırılıyor. NVIDIA hisseleri 19 Haziran'da 210,69 dolardan işlem görerek şirkete 5,14 trilyon dolarlık bir piyasa değeri kazandırdı. Soğutma inovasyonu, AI altyapısını ölçeklendirmenin önündeki kilit bir darboğazı ortadan kaldırarak, hiper ölçekleyicilerin veri merkezi gücünün her watt'ını mercek altına aldığı bir dönemde NVIDIA'nın AMD ve özel ASIC rakiplerine karşı rekabetçi konumunu güçlendiriyor.
45°C Soğutucu Sıvı Veri Merkezlerinin Fiziğini Nasıl Değiştiriyor
Geleneksel veri merkezleri, sıcak ve soğuk koridorlardan hava üflemek için enerji yoğun soğutma gruplarına ve fanlara güvenir; soğutma fanları 85 desibel veya üzerinde gürültü seviyeleri oluşturur. NVIDIA'nın yaklaşımı bu modeli tersine çeviriyor: sıvı soğutmalı soğuk plakalar aracılığıyla ısıyı doğrudan çipten yakalayarak sistem, yılın büyük bölümünde mekanik soğutmaya ihtiyaç duymadan ısıyı açık hava kuru soğutucuları (esasen büyük radyatör bobinleri) aracılığıyla atabiliyor.
Coğrafi konum bu noktada önemli. Daha serin iklimlerdeki tesisler tamamen soğutma grubu olmadan çalışabilirken, Phoenix gibi yerler yoğun yaz günlerinde minimum düzeyde soğutma grubu aktivasyonuna ihtiyaç duyabilir. Daha sıcak bölgelerde bile, 45°C soğutucu sıvıya geçiş, operatörleri bu soğutma grubusuz ideale yaklaştırıyor ve soğutma grupları potansiyel olarak yılda yalnızca birkaç gün çalışabiliyor.
Rubin platformu ayrıca soğuk plakalarında mikrokanal teknolojisini tanıtıyor; akış kanalları hassas frezeleme, sıyırma, lazer işleme, dağlama veya 3D baskı gibi teknikler kullanılarak mikron seviyesinde hassasiyetle işleniyor. Huayuan Securities analisti Li Ze'ye göre, alüminyuma kıyasla üstün termal iletkenliği nedeniyle bu mikrokanal soğuk plakalar için tercih edilen taban malzemesi bakır.
Tedarik Zinciri ve Rekabetçi Etkiler
%100 sıvı soğutmaya geçiş, veri merkezi tedarik zincirinde dalga etkileri yaratıyor. Schneider Electric'in ileri soğutma bölümü olan Motivair, yaklaşık on yıldır NVIDIA'nın ürün yol haritasıyla birlikte çalışarak güvenilirliği artırmak ve sızıntı risklerini en aza indirmek için yüksek empedanslı soğutucu sıvı formülasyonları geliştiriyor. "Çip başına watt belirli bir seviyeyi geçtiğinde, sıvı soğutma zorunlu hale geldi," dedi Motivair Başkanı ve CEO'su Richard Whitmore.
AI altyapısı kuran bulut sağlayıcıları için operasyonel tasarruflar önemli boyutlarda. Geleneksel soğutma kulesi sistemleri kullanan bir tesis, megavat başına yılda yaklaşık 2,6 milyon galon su tüketiyor. NVIDIA'nın kapalı döngü tasarımı bu tüketimin neredeyse tamamını ortadan kaldırıyor. Atık ısı geri kazanımı potansiyeli - AI fabrikalarından kalan ısının yakındaki ticari veya konut binalarını ısıtmak için yeniden kullanılması - başka bir değer katmanı ekliyor.
Blackwell'in halefi olan NVIDIA'nın Rubin mimarisi, hiper ölçekli AI dağıtımlarının bir sonraki dalgasına güç vermek üzere planlanmış durumda. Tek kabin gücünün 200 kW'ı aştığı bu yoğunluklarda hava soğutma artık geçerli bir seçenek değil. AMD ve giderek büyüyen özel ASIC tasarımcılarından oluşan bir kadro dahil olmak üzere rakiplerin, AI donanım pazarında rekabetçi kalabilmek için NVIDIA'nın termal mühendisliğine ayak uydurması gerekecek.
NVIDIA hisseleri ileriye dönük kazançların yaklaşık 35 katından işlem görüyor. Soğutma verimliliği kazanımları, kurulu tabanda geniş çapta benimsenirse, hiper ölçekleyiciler için toplam sahip olma maliyetini yıllık yüz milyonlarca dolar azaltabilir - bu, Rubin raflarının prim fiyatlandırmasını haklı çıkarabilecek ve NVIDIA'nın AI altyapısındaki baskın konumunu pekiştirebilecek bir faktör.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.