Doğal dil arayüzleri (NLI), Büyük Dil Modelleri (LLM) ile etkileşimde esneklik sunsa da, makale bu yaklaşımın yavaş ve maliyetli olduğunu savunuyor. LLM çıkarımının genellikle saniyeler sürdüğü, geleneksel grafik kullanıcı arayüzlerinin (GUI) ise milisaniyeler içinde yanıt verdiği belirtiliyor. Bu durum, LLM'lerden vazgeçmek yerine, arayüz tasarımında daha akıllıca yaklaşımlar benimsemenin gerekliliğini ortaya koyuyor. Makale, doğal dilin tüm faydalarını korurken, GUI'lerin hız ve yapısal avantajlarını birleştiren hibrit çözümlerin önemine dikkat çekiyor.
LLM etkileşimlerindeki gecikme sorunu, çok adımlı görevlerde kullanıcı deneyimini olumsuz etkiliyor. Bir kontrol listesi doldurma, açılır menüden seçim yapma veya bir kaydırıcıyı ayarlama gibi yapılandırılmış işlemler, GUI'ler aracılığıyla anında gerçekleştirilirken, doğal dil tabanlı etkileşimler çok daha uzun sürüyor. GUI'ler hızlı olsa da, anlamsal anlama yeteneğinden yoksun ve konuşmaya göre kendini şekillendiremiyor. Bu da, her iki dünyanın en iyi özelliklerini bir araya getiren bir yaklaşıma olan ihtiyacı gösteriyor.
Makale, bu hibrit yaklaşımı somutlaştıran "popup-mcp" adlı bir araç sunuyor. Bu araç, bir LLM'in dinamik olarak çoktan seçmeli kutular, açılır menüler, kaydırıcılar ve metin kutuları gibi çeşitli GUI öğelerini içeren bir açılır pencere oluşturmasına olanak tanıyor. popup-mcp, koşullu görünürlük desteği sayesinde, LLM'lerin bağlama özel takip soruları oluşturarak karmaşık diyalog ağaçları kurmasına imkan veriyor. Bu sayede, LLM'ler sadece bir sonraki konuşma aşamasını değil, aynı zamanda konuşmanın olası ilerleyişini de öngörerek daha akıllı ve etkili kullanıcı etkileşimleri sağlayabiliyor.
Yapay zeka arayüzlerinin geleceği, doğal dilin esnekliğini geleneksel grafik kullanıcı arayüzlerinin hızıyla birleştiren akıllı hibrit çözümlerde yatıyor.