Ana Sayfa

NVIDIA PersonaPlex: Doğal ve Kişiselleştirilebilir Sohbet Yapay Zekası

1 dk okuma

Geleneksel sohbet yapay zekası sistemleri (ASR→LLM→TTS gibi basamaklı yapılar), ses ve rol kişiselleştirmesine izin verirken, konuşmalar robotik, garip duraklamalarla dolu ve doğal olmayan bir sıra ile ilerliyordu. Moshi gibi tam çift yönlü (full-duplex) modeller, gerçek zamanlı dinleme ve konuşma ile yapay zeka sohbetlerini daha doğal hale getirse de, tek bir sabit ses ve rol ile sınırlı kalıyordu. NVIDIA PersonaPlex, bu ikilemi ortadan kaldırıyor. Kullanıcılar, geniş bir ses yelpazesinden seçim yapabilir ve metin istemleri aracılığıyla herhangi bir rolü tanımlayabilirler. İster bilge bir asistan, ister bir müşteri hizmetleri temsilcisi, ister fantastik bir karakter veya sadece sohbet edecek biri olsun, PersonaPlex seçilen kişiliği koruyarak gerçekten doğal sohbetler sunuyor.

PersonaPlex, aynı anda hem dinleyip hem de konuşabilen tam çift yönlü bir modeldir. Bu yetenek, sadece konuşmanın içeriğini değil, aynı zamanda ne zaman duraklanacağı, ne zaman araya girileceği veya "hımm", "oh" gibi geri bildirimlerin (backchannel) nasıl verileceği gibi konuşma davranışlarını da öğrenmesini sağlar. Ayrı dinleme (ASR), dil üretimi (LLM) ve konuşma (TTS) modelleri kullanan basamaklı sistemlerle ilişkili gecikmeleri ortadan kaldırarak düşük gecikmeli etkileşim elde edilir. PersonaPlex, kullanıcı konuşurken dahili durumunu güncelleyen ve yanıtı anında geri aktaran tek bir model kullanır. Bu yaklaşım, insan konuşmalarındaki niyet, duygu veya anlama ipuçlarını yeniden yaratmaya yardımcı olan sözel olmayan yönlerle zenginleştirilmiş bir çıktı sunar.

İçgörü

NVIDIA PersonaPlex, yapay zeka sohbetlerinde kişiselleştirme ve doğal etkileşimi aynı anda sunarak kullanıcı deneyimini önemli ölçüde geliştiriyor.

Kaynak