3 haber bu etiketle işaretlenmiş
BullshitBench, yapay zeka modellerinin kulağa mantıklı gelen ancak aslında saçma olan bilgileri tespit etme yeteneğini ölçen yeni bir kıyaslama aracıdır. Yazılım, tıp, hukuk, finans ve fizik gibi beş ...
Hugging Face Spaces üzerinde yer alan UGI Leaderboard (Uncensored General Intelligence Leaderboard), yapay zeka topluluğu için büyük dil modellerinin (LLM) sansürsüz genel zeka yeteneklerini değerlend...
Temel modellerdeki araştırma ilerlemesini yönlendiren en önemli unsurlardan biri ampirik değerlendirmelerdir. Gelişmiş görsel-dil modelleri (VLM'ler) üzerine yoğun çalışmalar olmasına rağmen, bu model...
Tüm haberler yüklendi