Yapay zeka eğitiminden çıkarıma geçiş, bellek endüstrisini HBM'nin çok ötesine uzanan şekillerde dönüştürüyor. KV önbellek boşaltımı ve ajanik yapay zeka iş yükleri, kurumsal SSD'ler ve LPDRAM için iki farklı büyüme pazarı yaratıyor.
"Yapay zekanın bellek sistemi, depolama sistemlerini tamamen dönüştürecek," dedi Nvidia kurucusu ve Üst Yöneticisi (CEO) Jensen Huang, Haziran 2026'da GTC Taipei konferansında. Bellek altyapısını yapay zeka yığınının en zorlu parçalarından biri olarak nitelendirdi.
Yapısal dönüşüm iki güç tarafından yönlendiriliyor. İlk olarak, çıkarım iş yükleri KV önbellek talebinde patlama yaratıyor — ön doldurma aşamasında anahtar-değer vektörlerini depolayan ve kod çözme sırasında gereksiz hesaplamayı önleyen dinamik bellek. Nvidia verileri, sorgu başına ortalama çıktı token sayısının 2024'ün ikinci yarısından bu yana yıllık bazda beş kattan fazla arttığını ve yaklaşık 30.000 ila 40.000 tokene ulaştığını gösteriyor. GPU HBM kapasitesi tükendiğinde, sistemler önbelleği atmalı ve yeniden hesaplamalıdır; bu da gecikmeyi ve toplam sahip olma maliyetini artırır.
Bunu çözmek için Nvidia, Mart 2025'te Dynamo yazılımını piyasaya sürdü. Bu yazılım, daha az sıklıkla erişilen KV önbelleğini CPU DRAM ve SSD'ler dahil daha ucuz bellek katmanlarına boşaltıyor. Şirket, Ocak 2026'da BlueField-4 DPU tarafından yönetilen CMX Context Memory Storage Platform'u tanıttı. Her raf, yaklaşık 9.600 terabayt kapasiteyi yönetmek için 64 BlueField-4 DPU kullanarak, yerel SSD ve paylaşımlı depolama arasına yeni bir "G3.5" pod seviyesi bağlam depolama katmanı yerleştiriyor. Computex 2026'da Nvidia'nın BlueField-4 DPU yapısal modeli halihazırda SK Hynix PEB210 E1.S ve PE9010 M.2 SSD örneklerini içeriyordu; bu da SSD POD alt pazarının kavramdan donanıma geçtiğinin sinyalini veriyor.
Ajanik Yapay Zeka CPU Bellek Talebini Yeniden Şekillendiriyor
İkinci itici güç, modellerin aktif olarak planlama yapması, araçları çağırması, kararlar alması ve ajan döngülerini yürütmesi gereken ajanik yapay zeka — tüm bu görevler CPU tarafından gerçekleştirilir. Huang, ajanların nano saniye ölçeğinde bir dünyada yaşadığını ve ultra düşük gecikmenin çok önemli olduğunu belirterek CPU mimarisinin önemini vurguladı.
TrendForce tahminlerine göre, ajanik yapay zeka dağıtımları ölçeklendikçe, CPU-GPU iş yükü oranı geleneksel 1:4 veya 1:8'den yaklaşık 1:1'e kayacak ve CPU'ya bağlı bellekte önemli bir artan talep yaratacak. Nvidia'nın 2026'da ajanik iş yükleri için piyasaya sürdüğü Vera CPU, selefi Grace'in üç katı kapasiteyle 1,5 terabayta kadar LPDDR5X'i destekliyor.
Ancak TrendForce, Nvidia'nın bir sonraki nesil Vera Rubin süper çip modülündeki SOCAMM bellek kapasitesini yarıya indirdiğini ve bunun nedeninin tedarikçilerin 2027 için ön üretim planlarında Nvidia'ya tahsis edilen LPDRAM kapasitesinin yetersiz olması olduğunu bildirdi. Bu ayarlama, Nvidia'nın genel bellek talebinde bir azalmadan ziyade kısa vadeli arz kısıtlamalarını yansıtıyor.
Daha geniş CPU pazarı, ajanik yapay zeka için kendi nesil yenilemesini geçiriyor. Intel Xeon 6+'ı (Clearwater Forest) piyasaya sürdü, AMD EPYC Venice'i çıkardı, Arm Arm AGI CPU'sunu tanıttı ve Ampere'nin AmpereOne MX'inin bu yıl üretime girmesi bekleniyor. Çok satıcılı rekabet, sektör genelinde CPU bellek talebi büyümesini hızlandırıyor.
Yatırım Çıkarımları
Bellek yatırımcıları için bu iki eğilim, HBM'nin ötesinde büyüme pazarlarına işaret ediyor. Nvidia, Google ve diğer platform satıcıları SSD POD mimarilerini devreye aldıkça, kurumsal SSD'ler KV önbellek boşaltımından yeni bir talep vektörü kazanıyor. Ajanik yapay zeka, sunucu mimarilerini dengeli CPU-GPU konfigürasyonlarına doğru iterken LPDRAM, CPU tarafında yapısal talep genişlemesi görüyor.
Nvidia'nın Vera Rubin'i için belirtilen arz kısıtlaması, kısa vadede LPDRAM kapasitesinin sıkı olabileceğini gösteriyor; bu da LPDRAM üretiminin büyük kısmını kontrol eden SK Hynix, Samsung Electronics ve Micron Technology gibi yerleşik bellek üreticilerine fayda sağlıyor. SSD üreticileri için, yapay zeka altyapısında özel bağlam depolama katmanlarının ortaya çıkması, iki yıl önce var olmayan yeni bir adreslenebilir pazarı temsil ediyor.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.