Ana Sayfa

MiniMax M2.5 Tanıtıldı: Kodlamada Yeni Bir Dönüm Noktası

1 dk okuma

MiniMax, en yeni yapay zeka modeli M2.5'i duyurdu. Bu model, yüz binlerce karmaşık gerçek dünya ortamında pekiştirmeli öğrenmeyle kapsamlı bir şekilde eğitilerek kodlama, aracı tabanlı araç kullanımı, arama ve ofis işleri gibi ekonomik açıdan değerli birçok görevde son teknoloji (SOTA) seviyesine ulaştı. M2.5, SWE-Bench Verified'da %80,2, Multi-SWE-Bench'te %51,3 ve BrowseComp'ta %76,3 gibi etkileyici skorlar elde etti. Önceki sürüm M2.1'e göre SWE-Bench Verified değerlendirmesini %37 daha hızlı tamamlayarak Claude Opus 4.6 ile aynı hıza ulaştı. Ayrıca, saatte 100 token hızında sürekli çalıştırıldığında sadece 1 dolara mal olmasıyla, kullanıcıların maliyet konusunda endişelenmesine gerek kalmayacak kadar uygun fiyatlı bir çözüm sunuyor.

M2.5'in kodlama yetenekleri, önceki nesillere kıyasla önemli ölçüde gelişti ve özellikle çok dilli kodlama görevlerinde belirgin bir üstünlük gösterdi. Model, bir yazılım mimarı gibi düşünme ve planlama yeteneğine sahip; kod yazmaya başlamadan önce projenin özelliklerini, yapısını ve kullanıcı arayüzü tasarımını aktif olarak ayrıştırıp planlayabiliyor. Go, C, C++, TypeScript, Rust, Kotlin, Python, Java, JavaScript, PHP, Lua, Dart ve Ruby dahil olmak üzere 10'dan fazla dilde ve 200.000'den fazla gerçek dünya ortamında eğitilen M2.5, hata düzeltmenin çok ötesine geçerek karmaşık sistemlerin tüm geliştirme yaşam döngüsü boyunca güvenilir performans sunuyor. Bu, sıfırdan sistem tasarımına, geliştirmeye, özellik yinelemesine ve kapsamlı kod incelemesi ile sistem testine kadar her aşamayı kapsıyor. Web, Android, iOS ve Windows gibi birden fazla platformda tam yığın projeleri destekleyerek sunucu tarafı API'leri, iş mantığını ve veritabanlarını da içeriyor.

MiniMax, bu yetenekleri değerlendirmek için VIBE benchmark'ını daha karmaşık ve zorlu bir Pro sürümüne yükseltti. M2.5, bu yeni benchmark'ta Opus 4.5 ile aynı seviyede performans gösteriyor. Ayrıca, farklı kodlama aracı sistemleri (Droid ve OpenCode) üzerinde yapılan SWE-Bench Verified değerlendirmelerinde de Opus 4.6'yı geride bırakarak genelleme yeteneğini kanıtladı.

İçgörü

Bu model, yapay zeka destekli yazılım geliştirmede maliyet etkinliği ve performansı bir araya getirerek geliştiricilere ve işletmelere önemli bir verimlilik artışı vadediyor.

Kaynak