MiniMax M2.5 Tanıtıldı: Kodlamada Yeni Bir Dönüm Noktası

MiniMax, en yeni yapay zeka modeli M2.5'i duyurdu. Bu model, yüz binlerce karmaşık gerçek dünya ortamında pekiştirmeli öğrenmeyle kapsamlı bir şekilde eğitilerek kodlama, aracı tabanlı araç kullanımı, arama ve ofis işleri gibi ekonomik açıdan değerli birçok görevde son teknoloji (SOTA) seviyesine ulaştı. M2.5, SWE-Bench Verified'da %80,2, Multi-SWE-Bench'te %51,3 ve BrowseComp'ta %76,3 gibi etkileyici skorlar elde etti. Önceki sürüm M2.1'e göre SWE-Bench Verified değerlendirmesini %37 daha hızlı tamamlayarak Claude Opus 4.6 ile aynı hıza ulaştı. Ayrıca, saatte 100 token hızında sürekli çalıştırıldığında sadece 1 dolara mal olmasıyla, kullanıcıların maliyet konusunda endişelenmesine gerek kalmayacak kadar uygun fiyatlı bir çözüm sunuyor.

M2.5'in kodlama yetenekleri, önceki nesillere kıyasla önemli ölçüde gelişti ve özellikle çok dilli kodlama görevlerinde belirgin bir üstünlük gösterdi. Model, bir yazılım mimarı gibi düşünme ve planlama yeteneğine sahip; kod yazmaya başlamadan önce projenin özelliklerini, yapısını ve kullanıcı arayüzü tasarımını aktif olarak ayrıştırıp planlayabiliyor. Go, C, C++, TypeScript, Rust, Kotlin, Python, Java, JavaScript, PHP, Lua, Dart ve Ruby dahil olmak üzere 10'dan fazla dilde ve 200.000'den fazla gerçek dünya ortamında eğitilen M2.5, hata düzeltmenin çok ötesine geçerek karmaşık sistemlerin tüm geliştirme yaşam döngüsü boyunca güvenilir performans sunuyor. Bu, sıfırdan sistem tasarımına, geliştirmeye, özellik yinelemesine ve kapsamlı kod incelemesi ile sistem testine kadar her aşamayı kapsıyor. Web, Android, iOS ve Windows gibi birden fazla platformda tam yığın projeleri destekleyerek sunucu tarafı API'leri, iş mantığını ve veritabanlarını da içeriyor.

MiniMax, bu yetenekleri değerlendirmek için VIBE benchmark'ını daha karmaşık ve zorlu bir Pro sürümüne yükseltti. M2.5, bu yeni benchmark'ta Opus 4.5 ile aynı seviyede performans gösteriyor. Ayrıca, farklı kodlama aracı sistemleri (Droid ve OpenCode) üzerinde yapılan SWE-Bench Verified değerlendirmelerinde de Opus 4.6'yı geride bırakarak genelleme yeteneğini kanıtladı.

MiniMax M2.5 Tanıtıldı: Kodlamada Yeni Bir Dönüm Noktası

Spotify'ın Geliştiricileri Yapay Zeka ile Kod Yazmayı Bıraktı

IBM, Yapay Zeka Çağında Giriş Seviyesi İş Alımlarını Üçe Katlıyor

Yazılım Geliştirmede Son Darboğaz

MiniMax M2.5 Tanıtıldı: Kodlamada Yeni Bir Dönüm Noktası

Spotify'ın Geliştiricileri Yapay Zeka ile Kod Yazmayı Bıraktı

IBM, Yapay Zeka Çağında Giriş Seviyesi İş Alımlarını Üçe Katlıyor

Yazılım Geliştirmede Son Darboğaz

Benzer Haberler

Spotify'ın Geliştiricileri Yapay Zeka ile Kod Yazmayı Bıraktı

IBM, Yapay Zeka Çağında Giriş Seviyesi İş Alımlarını Üçe Katlıyor

Yazılım Geliştirmede Son Darboğaz

Benzer Haberler

Spotify'ın Geliştiricileri Yapay Zeka ile Kod Yazmayı Bıraktı

IBM, Yapay Zeka Çağında Giriş Seviyesi İş Alımlarını Üçe Katlıyor

Yazılım Geliştirmede Son Darboğaz