Web tarayıcılarında otonom görevleri yerine getiren yapay zeka ajanlarının güvenilirliği, genellikle modelin büyüklüğü veya görsel girdi miktarı ile ilişkilendirilir. Ancak Sentience API tarafından yapılan bir Amazon vaka çalışması, bu yaygın inancın aksine, güvenilirliğin anahtarının "doğrulama katmanı" olduğunu ortaya koyuyor. Makale, tarayıcı ajanlarının her adımını yapılandırılmış anlık görüntüler ve Jest benzeri iddialarla doğrulamanın, küçük yerel modellerin bile güvenilir bir şekilde çalışmasını sağladığını gösteriyor. Bu yaklaşım, ajanların ekran görüntüleri yerine sayfanın yapısal verilerini (roller, metin, geometri) kullanarak daha tutarlı ve hatasız etkileşimler gerçekleştirmesine olanak tanıyor.
Çalışma, bir Amazon alışveriş akışını tamamlayan dört farklı deneyi inceliyor ve temel bulgular sunuyor. Buna göre, her adımın doğrulama kapılarıyla kontrol edildiği durumlarda, tamamen otonom bir akışın yerel modellerle bile başarıyla tamamlanabileceği kanıtlanmıştır. Ayrıca, token verimliliğinin model seçiminden ziyade arayüz tasarımı (yapılandırma ve filtreleme) ile artırılabileceği ve planlayıcı hatalarının sessizce ilerlemek yerine açıkça "BAŞARISIZ" olarak yüzeye çıkarıldığı vurgulanıyor. Bu "doğrulama > zeka" prensibi, küçük ve yerel yürütücü modellerin (executor) büyük planlayıcı modellerle (planner) birleştirildiği "imkansız kıyaslama" senaryosunda bile güvenilir uçtan uca davranış elde edilmesini mümkün kılıyor.
Sonuç olarak, makale yapay zeka ajanlarının web etkileşimlerinde güvenilirliği artırmak için modelin "akıllı" olmasından ziyade, eylemlerin ve durum değişikliklerinin titizlikle doğrulanmasının kritik önem taşıdığını gösteriyor. Bu yöntem, hem maliyet etkinliği hem de hata tespiti açısından önemli avantajlar sunarak, daha sağlam ve öngörülebilir otonom sistemlerin geliştirilmesinin önünü açıyor.
Yapay zeka ajanlarının web etkileşimlerinde güvenilirliği, model büyüklüğü veya görsel girdi yerine, her adımı doğrulayan sağlam bir katmanla sağlanır.