Microsoft, yapay zeka token üretiminin ekonomik verimliliğini önemli ölçüde artırmak üzere tasarlanmış çığır açan çıkarım hızlandırıcısı Maia 200'ü tanıttı. TSMC'nin 3nm üretim süreciyle üretilen bu güçlü hızlandırıcı, yerel FP8/FP4 tensör çekirdekleri, 7 TB/s hızında 216GB HBM3e ve 272MB yonga üstü SRAM içeren yeniden tasarlanmış bir bellek sistemi sunuyor. Bu özellikler, büyük modellerin hızlı ve yüksek verimlilikle çalışmasını sağlayan veri taşıma motorlarıyla birleşiyor. Maia 200, hyperscaler'lar arasında en yüksek performansı sunan ilk parti silikon olma özelliğini taşıyor; Amazon Trainium ve Google TPU gibi rakiplerinden daha iyi FP4 ve FP8 performansı sunarken, Microsoft'un mevcut donanımlarına göre dolar başına %30 daha iyi performans sağlıyor.
Maia 200, Microsoft'un heterojen yapay zeka altyapısının bir parçası olarak, OpenAI'nin en yeni GPT-5.2 modelleri de dahil olmak üzere çeşitli modelleri destekleyecek. Bu sayede Microsoft Foundry ve Microsoft 365 Copilot gibi hizmetlere performans avantajı getirecek. Microsoft Superintelligence ekibi, sentetik veri üretimi ve pekiştirmeli öğrenme için Maia 200'ü kullanarak yeni nesil şirket içi modelleri geliştirecek. Maia 200'ün benzersiz tasarımı, yüksek kaliteli, alana özgü verilerin daha hızlı üretilmesine ve filtrelenmesine yardımcı olarak, sonraki eğitim süreçlerini daha güncel ve hedefe yönelik sinyallerle besleyecek.
Maia 200, ilk olarak ABD'deki US Central veri merkezinde devreye alındı ve ardından US West 3 ile diğer bölgeler takip edecek. Azure ile sorunsuz bir şekilde entegre olan Maia 200 için, modelleri oluşturmak ve optimize etmek için eksiksiz bir araç seti sunan Maia SDK'nın önizlemesi de yapılıyor. Bu SDK, PyTorch entegrasyonu, bir Triton compiler ve optimize edilmiş çekirdek kütüphanesi gibi yetenekleri içeriyor. Bu sayede geliştiricilere gerektiğinde hassas kontrol sağlanırken, heterojen donanım hızlandırıcıları arasında model taşımayı kolaylaştırıyor.
Yapay zeka çıkarım süreçlerinde maliyet etkinliğini ve performansı önemli ölçüde artıran bu yeni çip, Microsoft'un yapay zeka hizmetlerini ve modellerini daha verimli hale getirecek.