75 haber bu etiketle işaretlenmiş
Sebastian Raschka'nın "LLM Architecture Gallery" sayfası, büyük dil modellerinin (LLM) mimarilerini ve teknik özelliklerini bir araya getiren kapsamlı bir kaynak sunuyor. "The Big LLM Architecture Com...
Büyük dil modelleri (LLM'ler) ajan olarak kullanıldığında, genellikle çevresel kurallara aykırı veya suboptimal eylemler gerçekleştirebilirler. Örneğin, yakın zamanda düzenlenen Kaggle GameArena satra...
Anthropic, Claude Opus 4.6 ve Sonnet 4.6 modelleri için 1 milyon token'lık bağlam penceresinin (context window) artık genel kullanıma sunulduğunu duyurdu. Bu önemli gelişme ile birlikte, her iki model...
Büyük Dil Modelleri (LLM'ler), genellikle metin üretme, anlama ve özetleme gibi dil tabanlı görevlerdeki üstün yetenekleriyle tanınır. Ancak, "LLM'ler Bilgisayar Olabilir mi?" başlıklı bu makale, bu m...
Percepta'nın bu çığır açan makalesi, Büyük Dil Modelleri'nin (LLM) kendi içlerinde programları yürütebilme potansiyelini araştırıyor ve bu sayede çıkarım (inference) hızında üstel bir artış vaat ediyo...
Bir makale, Büyük Dil Modelleri'nin (LLM) kodlama performansını incelerken, testleri geçme oranları ile bir yazılım geliştiricisi tarafından onaylanacak "birleştirilebilir" (mergeable) kod üretme oran...
Percepta'dan Christos Tzamos ve ekibinin yaptığı araştırma, Büyük Dil Modelleri'nin (LLM) sadece metin tabanlı görevleri yerine getirmekle kalmayıp, adeta bir bilgisayar gibi programları yürütebilme p...
2026 yılı, yapay zeka destekli otonom yazılım çevirileri konusunda büyük bir heyecanla başladı. Cursor ve Anthropic gibi şirketlerin yayınladığı çalışmalar, tarayıcılar, Java LSP'ler ve C derleyiciler...
Microsoft, 1-bit Büyük Dil Modelleri (LLM'ler) için tasarlanmış resmi çıkarım (inference) çerçevesi olan bitnet.cpp'yi tanıttı. Özellikle BitNet b1.58 gibi modeller için optimize edilmiş çekirdekler s...
Yazar, Google'ın yeni Gemini 3.1 Flash-Lite modelini "süper hızlı ve çok yetenekli" olarak tanımlayarak büyük bir beğeniyle karşılıyor. Özellikle hızları, uygun fiyatları ve görsel görevlerdeki üstün ...
Makine öğrenimi dünyasında "açık ağırlıklar" (open weights) kavramı, modelin önceden eğitilmiş parametrelerinin herkese açık olmasını ifade eder. Ancak bu makale, açık ağırlıkların, modelin kolayca ye...
Graviton, güçlü yapay zeka modellerini bulut tekellerinden kurtararak, herkesin kendi donanımında çalıştırmasını sağlayan devrim niteliğinde açık kaynaklı bir motordur. Özellikle 500 milyar parametre ...