MiniMax, Pazartesi günü amiral gemisi modeli M3'ü piyasaya sürerek, SWE-Bench Pro kriterinde GPT-5.5'i geride bırakan üst düzey kodlama performansına sahip olduğunu iddia etti. Çinli yapay zeka girişimi, Hong Kong hisselerinin Ocak ayından bu yana %409 yükselmesinin ardından Şanghay STAR Market'te ikincil bir halka arz peşinde koşuyor.
MiniMax bir açıklamada, modelin SWE-Bench Pro'da OpenAI'in GPT-5.5 ve Google'ın Gemini 3.1 Pro'sunun önünde yer aldığını ve yalnızca Anthropic'in Claude Opus 4.7'sinin gerisinde kaldığını belirtti. Otonom ajanlar için uçtan uca bir değerlendirme olan Claw-Eval'de ise M3, test edilen tüm modeller arasında en yüksek puanı elde etti.
MiniMax duyurusunda, "M3, aynı anda sınırda kodlama kabiliyeti, 1 milyon tokenlık bağlam pencereleri ve yerel çok modlu işleme sunan tek açık kaynak modeldir" dedi.
Üç teknoloji ağacı, tek model
M3, uzun bağlam işlemenin ikinci dereceden hesaplama maliyetini çözmek için tasarlanmış yeni bir dikkat mimarisi olan MiniMax Sparse Attention'ı (MSA) tanıtıyor. Mekanizma iki aşamalı bir yaklaşım kullanıyor: Hafif bir Index Attention aşaması, blok maksimum havuzlama yoluyla ilk-k alakalı KV bloklarını seçiyor, ardından yalnızca bu bloklar üzerinde tam seyrek dikkat hesaplaması yapılıyor. MiniMax'e göre, 1 milyon tokenda M3'ün token başına hesaplaması önceki neslinin yirmide biri seviyesinde olup, ön doldurma hızı 9,7 kat, çözümleme hızı ise 15,6 kat arttı.
Şirket, M3'ün ilk ön eğitim adımından itibaren serpiştirilmiş metin-görüntü verileriyle eğitildiğini ve veri hattının 100 trilyona kadar tokenı işleyecek şekilde yeniden oluşturulduğunu söyledi. MiniMax, bu yılın başlarında M2.5 ve M2.7 modellerini açık kaynak olarak yayınlamıştı ve M3'ün ağırlıklarının ve teknik raporunun 10 gün içinde yayınlanacağını duyurdu.
Modelin birleşik yeteneklerini göstermek için MiniMax, M3'ü ince ayar sırasında öğrenme dinamikleri üzerine ICLR 2025 Olağanüstü Makale Ödülü kazanan bir makaleyi bağımsız olarak yeniden üretmekle görevlendirdi. Model, insan müdahalesi olmadan yaklaşık 12 saat boyunca çalışarak 18 commit ve 23 deneysel grafik üretti. DPO eğitiminde gözlemlenen sıkıştırma etkisi ve önerilen Extend hafifletme yönteminin etkinliği de dahil olmak üzere makalenin temel deneylerini başarıyla kopyaladı.
Ayrı bir testte M3, Nvidia'nın Hopper mimarisinde bir FP8 matris çarpım çekirdeğini optimize etti ve işlevsel olmayan bir Triton iskeletinden başladı. 24 saat boyunca model, 147 kıyaslama ve 1.959 araç çağrısı göndererek Hopper FP8 zirve donanım kullanımını %7,6'dan %71,3'e çıkardı — bu 9,4 katlık bir hızlanma anlamına geliyor. Rakiplerin çoğu 30 gönderim içinde ilerleme kaydetmeyi durdururken, M3'ün optimal sonucu 145. gönderimde geldi.
Halka arz ivmesi ve finansal bağlam
Model lansmanı, MiniMax'in 29 Mayıs'ta Şanghay CSRC'ye bir listeleme danışmanlık raporu sunmasından ve CITIC Securities'in danışman olarak yer aldığı A hissesi halka arz sürecini başlatmasından günler sonra gerçekleşti. Şirket, Ocak ayında Hong Kong'da hisse başına 165 HK$'dan halka arz edilerek yaklaşık 619 milyon dolar topladı. Hisse senedi 29 Mayıs'ta 840 HK$'dan kapanarak şirketi 263,45 milyar HK$ veya kabaca 33,8 milyar dolar olarak değerledi.
28 Mayıs'ta açıklanan iş metriklerine göre, MiniMax'in yıllıklandırılmış yinelenen geliri Mayıs sonu itibarıyla 300 milyon doları aştı ve iki ayda iki kattan fazla arttı. Şirket, 2025 gelirini 79 milyon dolar, brüt kar marjını %25,4 ve düzeltilmiş net zararını 250 milyon dolar olarak bildirdi. 1 milyondan fazla kurumsal ve geliştirici müşterisi ve yaklaşık 300 milyon küresel kullanıcısı bulunuyor.
Şanghay listelemesi, Pekin'in yapay zeka şampiyonlarının ülkede finanse edilmesi gerektiğinin sinyalini verdiği bir dönemde MiniMax'e daha derin iç sermaye piyasalarına erişim sağlayacak. Şirket, Çin'in yapay zeka sektörünün teknik güvenilirliği piyasa değerine dönüştürmek için yarıştığı bir ortamda Zhipu ve Moonshot gibi emsallerine katılarak halka arz peşinde koşuyor.
Halka arz fiyatından %400'den fazla yükselen MiniMax hisseleri, küresel yapay zeka emsallerinin çoğuna kıyasla önemli bir primle işlem görüyor. Şirket, 8 Haziran'da Hang Seng Teknoloji Endeksi'ne dahil olacak. M3'ün kriter performansının bu değerlemeyi sürdürüp sürdüremeyeceği — ve STAR Market listelemesinin benzer koşullarla ilerleyip ilerlemeyeceği — modelin teknik başarıları ölçekte kurumsal gelire dönüştürme yeteneğine bağlı olacak.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.