Chroma'nın Temmuz ayındaki araştırması, büyük bağlam pencerelerinin bilgi erişim sorununu çözmediğini ve LLM performansının düştüğünü gösterdi. Makale, bilgi erişimi ve üretim süreçlerinin birbirinden ayrık olduğunu vurguluyor. Yapay zeka, ilgili bilgi parçalarını bulup kullanır ancak bu bilginin yanıtı iyileştirip iyileştirmediği konusunda geri bildirim almaz. Yanlış bir bilgi kullanıldığında, bu "bellek" aynı güvenle sistemde kalır, öğrenme boşluğu yaratır. Mevcut çözümler (yeniden sıralayıcılar, sorgu yeniden yazma) sorgu anında bilgi erişim kalitesini artırmaya çalışsa da, sonuçlardan öğrenme yeteneğine sahip değildir; başarı yerine anlamsal benzerliği optimize ederler. Roampal, bu sorunu sonuç odaklı öğrenme ile çözüyor. Kullanıcıların "işe yaradı" veya "bu yanlış" gibi geri bildirimleri doğrudan ilgili belleklere bağlanır. Böylece, iyi bellekler daha sık yüzeye çıkarken, kötü bellekler zamanla sistemin derinliklerine iner. Bu basit ama etkili yaklaşım, yapay zekanın kendi deneyimlerinden ders çıkarmasını sağlar. Roampal, bu sistemi geliştirirken üç temel sorunu çözmüştür. "Soğuk başlangıç" problemi için Wilson skorunu kullanarak yeni belleklerin güvenilirliğini değerlendirir. Ne zaman neye güvenileceği sorunu için, bellekler kullanılıp puanlandıkça gömülü temsiller ile sonuç skorları arasındaki ağırlık dinamik olarak ayarlanır. Sürtünmesiz puanlama için ise, LLM kullanıcının sonraki mesajını okuyarak yanıtının yardımcı olup olmadığını çıkarır. Bu sayede, kullanıcı manuel geri bildirimde bulunmadan sistem kendini geliştirir. Bu yaklaşım, anlamsal benzerliğin yanlış cevabı işaret ettiği zorlu testlerde %0 doğruluktan %60 doğruluğa çıkarak önemli bir başarı elde etmiştir.
Yapay zeka sistemlerinin bilgi erişimini, kullanıcı geri bildirimlerini otomatik olarak öğrenerek ve uygulayarak temelden iyileştirmek, geleneksel anlamsal benzerlik tabanlı yaklaşımların ötesine geçiyor.