16 haber bu etiketle işaretlenmiş
SoftMatcha 2, trilyonlarca kelimeden oluşan doğal dil veri kümelerinde, anlamsal varyasyonları (yerine koyma, ekleme ve silme) ele alarak 0.3 saniyenin altında ultra hızlı ve esnek arama yapmayı sağla...
CAD Search projesi, bir milyon adet CAD dosyasının işlenerek doğal dil kullanarak 3D modellerin aranabilmesini sağlayan çığır açıcı bir platform sunuyor. Geleneksel 3D model arama yöntemleri genellikl...
SMLL projesi, dil modellerinin (LLM) metin sıkıştırmadaki potansiyelini sıra dışı bir yaklaşımla ortaya koyuyor. Proje, Jane Austen'ın açılış cümlesi gibi kısa metinleri 117 bayttan 10 bayta kadar sık...
Büyük dil modellerindeki (LLM) doğrusal temsillerin, bir konuşma süresince nasıl dramatik bir şekilde evrildiğini inceleyen bu çalışma, dil modellerinin iç işleyişine dair önemli bulgular sunuyor. Ara...
Yapay zeka modellerini niteliksel ödüllerle eğitmek, özellikle mizah gibi öznel alanlarda büyük bir zorluk teşkil ediyor. Bir şeyin komik olup olmadığına dair iki kişinin farklı görüşlere sahip olması...
VibeVoice-ASR, Microsoft Research tarafından geliştirilen, 60 dakikaya kadar uzun formattaki ses kayıtlarını tek geçişte işleyebilmek üzere tasarlanmış birleşik bir konuşmadan metne dönüştürme (speech...
Moonshot AI tarafından geliştirilen Kimi K2.5, uzun bağlam anlama ve işleme yetenekleriyle öne çıkan gelişmiş bir büyük dil modelidir (LLM). Bu teknik rapor, modelin mimarisi, eğitim metodolojisi ve p...
Geleneksel sohbet yapay zekası sistemleri (ASR→LLM→TTS gibi basamaklı yapılar), ses ve rol kişiselleştirmesine izin verirken, konuşmalar robotik, garip duraklamalarla dolu ve doğal olmayan bir sıra il...
word2vec algoritması, kelimeleri anlamları benzer olanları birbirine yakın konumlandıran vektörlere dönüştürür. Bu sayede, "kral - erkek + kadın = kraliçe" gibi ünlü analojilerde olduğu gibi, vektör a...
İstatistiksel mekanikteki sıcaklık tanımından ve sıfırın altına düşme olasılığından esinlenerek, LLaMA dil modelini negatif sıcaklıkta örnekleme deneyi yapıldı. Bu deney, dil modellerinin metin üretim...
Büyük Dil Modelleri (LLM'ler), dilin oldukça düzensiz bilgi yoğunluğuna sahip olmasına rağmen tüm token'lara aynı düzeyde hesaplama uygular. Bu token-tabanlı, tekdüze hesaplama rejimi, yerel olarak ta...
Mevcut Transformer tabanlı dil modelleri, token bazında yatay tarama yaparak çalışır ve her üretim adımında giderek büyüyen bir token seviyesi durumları dizisine dikkat eder. Bu erişim deseni, ön dold...