Ana Sayfa

Nvidia Nemotron 3: Yapay Zeka Uygulamaları İçin Yeni Nesil Açık Modeller

1 dk okuma

NVIDIA, ajan tabanlı yapay zeka uygulamaları için tasarlanmış, yüksek verimli ve doğru sonuçlar veren yeni açık model ailesi Nemotron 3'ü duyurdu. Bu aile, Nano, Super ve Ultra olmak üzere üç farklı modelden oluşuyor. Her bir model, ajan tabanlı yetenekler, muhakeme ve sohbet becerileri konusunda güçlü performans sergiliyor. Nano, ailenin en küçük üyesi olmasına rağmen benzer modellere kıyasla daha yüksek doğruluk sunarken, çıkarım (inference) maliyetinde de oldukça verimli. Super modeli, iş birliğine dayalı ajanlar ve yüksek hacimli iş yükleri, özellikle IT bilet otomasyonu gibi alanlar için optimize edilmiş. Ultra ise ailenin en büyüğü olup, en güncel doğruluk ve muhakeme performansını sağlıyor. Şu an için Nemotron 3 Nano modeli ve teknik raporu yayınlanmış durumda; Super ve Ultra modellerinin ise önümüzdeki aylarda kullanıma sunulması bekleniyor.

Nemotron 3 modelleri, performanslarını artıran bir dizi yenilikçi teknolojiye sahip. Bunlar arasında, sınıfının en iyisi işlem hacmini sunarken standart Transformer modellerine kıyasla daha iyi veya eşdeğer doğruluk sağlayan hibrit Mamba-Transformer MoE (Mixture of Experts) mimarisi bulunuyor. Super ve Ultra modelleri, geliştirilmiş doğruluk için Latent MoE ve uzun metin üretimi verimliliği için Multi-Token Prediction (MTP) katmanlarını kullanıyor. Ayrıca, bu modeller 1 milyon tokene kadar uzun bağlam (context) desteği sunuyor ve çeşitli RL (Reinforcement Learning) ortamlarında eğitilerek geniş bir görev yelpazesinde üstün doğruluk elde ediyor. Nemotron 3 Nano, 3.2 milyar aktif parametreye sahip olup, GPT-OSS-20B ve Qwen3-30B-A3B gibi rakiplerine göre hem doğruluk hem de çıkarım hızı açısından önemli avantajlar gösteriyor. NVIDIA, Nemotron 3 Nano'nun model ağırlıklarını, eğitim tarifini ve yeniden dağıtım haklarına sahip olduğu tüm verileri açık kaynak olarak sunarak geliştiricilerin erişimine açıyor. Bu hamle, yapay zeka topluluğunun bu güçlü modellere kolayca erişmesini ve yenilikçi uygulamalar geliştirmesini sağlayacak.

İçgörü

NVIDIA'nın Nemotron 3 ailesi, özellikle ajan tabanlı yapay zeka uygulamaları için yüksek performanslı ve maliyet etkin açık modeller sunarak yapay zeka geliştirme süreçlerini hızlandırıyor ve yeni kullanım alanlarının önünü açıyor.

Kaynak