5 haber bu etiketle işaretlenmiş
AutoKernel, PyTorch modelleri için GPU çekirdeklerini otomatik olarak optimize eden yenilikçi bir araçtır. @karpathy/autoresearch projesinden ilham alan AutoKernel, otonom yapay zeka ajanlarının LLM e...
Modern derin öğrenme uygulamalarında GPU çekirdek optimizasyonu temel bir rol oynasa da, derinlemesine donanım uzmanlığı gerektiren zorlu bir görev olmaya devam etmektedir. Mevcut CUDA kod üretim yakl...
Luminal, yapay zeka çıkarım (inference) süreçlerini donanımın fiziksel sınırlarına taşıyarak GPU kullanımını en üst düzeye çıkarmayı hedefleyen bir derleyicidir. Çıkarım performansını sınırlayan iki t...
NVIDIA, CUDA çekirdek optimizasyonları için tasarlanmış, MLIR tabanlı bir ara temsil (IR) ve derleyici altyapısı olan CUDA Tile'ı açık kaynak olarak kullanıma sundu. Bu proje, özellikle döşeme (tile) ...
Derin öğrenme alanındaki en etkili optimizasyonlardan biri olan FlashAttention, 2022'de yayınlanmasından bu yana donanım gücü arttıkça performansı daha da artıran dört ana sürümle karşımıza çıktı. Anc...
Tüm haberler yüklendi