MiniMax, kendi geliştirme döngüsüne aktif olarak katılan ve bu döngüyü iyileştiren sektörün ilk ajan yapay zekası olan M2.7 modelini açık kaynaklı hale getirerek önde gelen tescilli modellerle aynı düzeyde performans sergiledi.
MiniMax, en yetenekli Uzmanlar Karışımı (MoE) modeli olan MiniMax M2.7'yi resmi olarak açık kaynaklı hale getirdi ve ağırlıklarını Hugging Face üzerinde halka açtı. Performansında %30 kazanç sağlamak için önce kendi geliştirmesinde yer alan model, SWE-Pro yazılım mühendisliği kıyaslamasında %56,22 puan alarak GPT-5.3-Codex ile eşleşti ve açık kaynaklı yapay zeka pazarında yeni bir rekabet cephesinin sinyalini verdi.
Şirket teknik bir blog yazısında, "Otonom iyileştirmenin sınırlarını test etmek için MiniMax M2.7, dahili bir iskele üzerinde bir modelin programlama performansını optimize etmekle görevlendirildi" dedi. "Tamamen otonom olarak çalıştı ve 100'den fazla tur boyunca 'başarısızlık yörüngelerini analiz et → değişiklikleri planla → iskele kodunu değiştir → değerlendirmeleri çalıştır → sonuçları karşılaştır → değişiklikleri tutmaya veya geri almaya karar ver' şeklinde bir yineleme döngüsü yürüttü."
Kendi kendine evrim süreci, dahili değerlendirmelerde %30 performans iyileşmesiyle sonuçlandı. Kamuoyuna açık kıyaslamalarda M2.7, açık kaynaklı modeller için son teknoloji sonuçlar elde ederek Terminal Bench 2'de %57,0 ve VIBE-Pro depo düzeyi kod oluşturma testinde %55,6 puan alarak Anthropic'in Opus 4.6'sına neredeyse yaklaştı. Model; Nvidia, Huawei Ascend ve Moore Threads gibi donanım üreticileriyle ortaklaşa geliştirilerek geniş bir başlangıç uyumluluğu sağlandı.
Bu sürüm, açık kaynaklı modeller ile OpenAI ve Anthropic gibi firmaların tescilli modelleri arasındaki performans farkına meydan okuyor. Kendi kendini iyileştirebilen ve karmaşık, gerçek dünya mühendislik görevlerinde yüksek performans sergileyen bir modeli açık kaynaklı hale getiren MiniMax, mevcut şirketler üzerinde baskı kuruyor ve geliştiricilere güçlü, ücretsiz erişilebilir bir araç sunuyor; bu da kurumsal yapay zeka tedariğini maliyetli API tabanlı sistemlerden uzaklaştırabilir.
Ajan Çalışmaları İçin Yeni Bir Mimari
MiniMax M2.7, şirketin M2 serisi Uzmanlar Karışımı (MoE) modellerinin bir parçasıdır. Bu mimari, çıkarım sırasında parametrelerin yalnızca bir alt kümesi etkinleştirildiğinden yoğun modellerden daha verimlidir, bu da onu daha hızlı ve daha ucuz hale getirir. Model, üç temel yetenek etrafında oluşturulmuştur: profesyonel yazılım mühendisliği, profesyonel ofis işleri ve MiniMax'ın "Ajan Ekipleri" olarak adlandırdığı yerel çoklu ajan iş birliği. Bu yetenekler, M2.7'nin karmaşık becerilerden ve dinamik araç aramalarından yararlanarak son derece karmaşık üretkenlik görevlerini tamamlamasına olanak tanır.
Gerçek Dünya Mühendisliğinde Mükemmellik
Modelin gerçek dünya mühendislik zorluklarını simüle eden kıyaslamalardaki performansı onu farklı kılıyor. Günlük analizi, hata giderme ve kod güvenlik incelemesi gibi görevleri kapsayan SWE-Pro'da M2.7’nin %56,22 doğruluğu GPT-5.3-Codex ile eşleşiyor. Bu, yalnızca kod oluşturma değil, yazılım sistemlerinin operasyonel mantığını anlama yeteneğini gösterir. MiniMax ekibi, bu yeteneğin dahili olarak canlı üretim sistemi olayları için kurtarma süresini üç dakikanın altına indirmek için kullanıldığını, modelin otonom olarak gözlemlenebilirlik analizi, veritabanı sorguları gerçekleştirdiğini ve birleştirme istekleri gönderdiğini bildiriyor.
Mühendisliğin Ötesinde: Profesyonel Ofis ve Finans Becerileri
Mühendislik yeteneğinin ötesinde, MiniMax M2.7 profesyonel ofis görevlerini de hedefliyor. 45 model arasında alan uzmanlığını ölçen GDPval-AA değerlendirmesinde M2.7, 1495 ELO puanı elde ederek tüm açık kaynaklı modeller arasında en yüksek sırayı aldı ve yalnızca Opus 4.6 ve GPT-5.4 gibi üst düzey tescilli modellerin ardından ikinci oldu. Finans alanında model, yıllık raporları otonom olarak okuyabilen, bir gelir tahmin modeli oluşturabilen ve bir araştırma raporu hazırlayabilen bir yardımcı analist olarak hareket edebilir. Bu geniş beceri seti, onu kurumsal ve profesyonel kullanım için konumlandırılmış modellerin doğrudan rakibi haline getiriyor. Bu doğrulanmış yeteneklere sahip bir modelin açık kaynaklı hale getirilmesi, benzer kapalı kaynaklı sistemlere erişim satmaya dayanan şirketlerin iş modellerini etkileyerek, çeşitli endüstrilerde ajan yapay zeka iş akışlarının benimsenmesini hızlandırabilir.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.