Yapay zeka ajan sistemleri, kodlama yardımcılarından kişisel sağlık koçlarına kadar gerçek dünya uygulamalarında giderek daha yaygın hale geliyor. Geleneksel makine öğrenimi modellerinin aksine, ajanlar tek seferlik tahminlerden ziyade sürekli, çok adımlı etkileşimleri yönetmek zorunda oldukları için yeni bir karmaşıklık katmanı sunar. Bu durum, standart doğruluk ölçütlerinin ötesine geçerek sistemlerin optimal performans için nasıl tasarlanması gerektiğini sorgulatıyor. Uygulayıcılar genellikle "daha fazla ajanın daha iyi olduğu" varsayımı gibi sezgisel yaklaşımlara güvenirken, Google Research'ten Yubin Kim ve Xin Liu, "Towards a Science of Scaling Agent Systems" başlıklı yeni makalelerinde bu varsayıma meydan okuyor.
Araştırma, 180 ajan konfigürasyonunun kontrollü bir değerlendirmesi aracılığıyla, ajan sistemleri için ilk nicel ölçeklendirme ilkelerini ortaya koyuyor. Bulgular, çoklu ajan koordinasyonunun paralel görevlerde performansı önemli ölçüde artırdığını, ancak sıralı görevlerde düşürdüğünü gösteriyor. Bu, "daha fazla ajan" yaklaşımının genellikle bir sınıra ulaştığını ve hatta görevin belirli özellikleriyle uyumlu değilse performansı düşürebileceğini ortaya koyuyor. Çalışma ayrıca, görünmeyen görevlerin %87'si için optimal mimariyi belirleyen tahmine dayalı bir model sunuyor.
Ajanların nasıl ölçeklendiğini anlamak için araştırmacılar, bir görevi "ajanik" yapan şeyin ne olduğunu tanımladılar. Ajanik görevler, harici bir ortamla sürekli çok adımlı etkileşimler, kısmi gözlemlenebilirlik altında yinelemeli bilgi toplama ve çevresel geri bildirime dayalı adaptif strateji iyileştirmesi olmak üzere üç spesifik özelliği gerektirir. Bu çerçevede, tek ajanlı sistem (SAS) ve bağımsız, merkezi, merkezi olmayan ve hibrit olmak üzere dört çoklu ajan varyantı dahil olmak üzere beş kanonik mimari, finansal muhakeme, web navigasyonu, planlama ve araç kullanımı gibi çeşitli dört kıyaslama üzerinde değerlendirildi. Bu çalışma, ajan sistemlerinin tasarımında daha bilimsel ve veriye dayalı bir yaklaşımın kapılarını aralıyor.
Yapay zeka ajan sistemlerinin ölçeklendirilmesinde 'daha fazla ajan daha iyidir' varsayımının her zaman geçerli olmadığını ve görev türüne göre farklı stratejiler gerektirdiğini gösteriyor.