Ana Sayfa

Sentience ile Tarayıcı Ajanlarında Güvenilirliği Artırmak: Amazon Vaka Çalışması

1 dk okuma

Makale, tarayıcı ajanlarının (browser agents) güvenilirliğini artırmak için yeni bir yaklaşımı, Sentience adlı bir doğrulama katmanını inceliyor. Geleneksel olarak, bu ajanlar ekran görüntüleri (pixels) üzerinden çalışır ve bu da belirsiz tıklamalar, algılanamayan navigasyon hataları ve gerçek durum değişikliği olmadan ilerleme gibi sorunlara yol açar. Sentience, bu sorunları aşmak için sayfayı yapılandırılmış bir anlık görüntü (structured snapshot) olarak ele alıyor. Bu anlık görüntüler, roller, metinler ve geometri gibi bilgileri içeriyor ve her eylemden sonra açıkça geçme/kalma doğrulamaları (Jest-style assertions) gerektiriyor. Yani, bir adım modelin söylediği için değil, tarayıcı durumundaki bir doğrulama geçtiği için başarılı sayılıyor.

Bu yaklaşım, küçük, yerel modellerin yürütücü (executor) olarak güvenilir bir şekilde kullanılmasını sağlıyor; daha büyük modeller ise yalnızca gerektiğinde planlama (reasoning) için ayrılıyor. Bu, hem token verimliliği sağlıyor hem de karmaşık görsel modellerine olan ihtiyacı azaltıyor. Amazon alışveriş akışı üzerinde yapılan bir vaka çalışması, bu yöntemin etkinliğini kanıtlıyor. Çalışma, "thinkpad" arama, ilk ürüne tıklama, sepete ekleme ve ödeme aşamasına geçme adımlarını içeriyor. Sonuçlar, doğrulama katmanı sayesinde yerel modellerle bile tam otonom bir akışın başarıyla tamamlanabildiğini gösteriyor.

Temel bulgular arasında, token verimliliğinin model seçiminden ziyade arayüz tasarımı (yapı ve filtreleme) ile artırılabileceği ve güvenilirliğin "zekadan" (daha fazla parametre veya piksel) çok doğrulamadan geldiği vurgulanıyor. Planlayıcıdaki sapmalar, sessizce ilerlemek yerine açık bir şekilde başarısızlık veya uyumsuzluk olarak ortaya çıkarılıyor. Bu da sistemin daha sağlam ve öngörülebilir olmasını sağlıyor.

İçgörü

Tarayıcı otomasyonunda güvenilirliği artırmak için modelin 'zekasından' ziyade yapılandırılmış doğrulama katmanlarının kritik olduğunu gösteriyor.

Kaynak