Anthropic araştırmacısı Nicholas Carlini, dil modellerini denetlemek için "ajan takımları" adını verdiği yenilikçi bir yaklaşım geliştirdi. Bu yöntemde, birden fazla Claude yapay zeka örneği, insan müdahalesi olmadan ortak bir kod tabanı üzerinde paralel olarak çalışarak, büyük ve karmaşık projelerin üstesinden gelinebileceğini gösteriyor. Bu yaklaşımın sınırlarını test etmek amacıyla, 16 Claude ajanı, sıfırdan Rust tabanlı bir C compiler yazmakla görevlendirildi. Hedef, bu compiler'ın Linux kernel'ını derleyebilmesiydi.
Yaklaşık 2.000 Claude Code oturumu ve 20.000 dolarlık API maliyetinin ardından, ajan takımı 100.000 satırlık bir compiler geliştirmeyi başardı. Bu compiler, x86, ARM ve RISC-V mimarilerinde Linux 6.9'u başarıyla derleyebiliyor. Carlini, makalede bu compiler'ın kendisinden ziyade, uzun süreli otonom ajan takımları için testler tasarlama, birden fazla ajanın paralel ilerlemesini sağlayacak iş yapıları oluşturma ve bu tür yaklaşımların karşılaştığı sınırlamalar üzerine edindiği derslere odaklanıyor. Mevcut ajan sistemlerinin aksine, Carlini Claude'u basit bir döngüye sokarak sürekli ve otonom ilerleme sağlayan bir sistem kurdu.
Paralel Claude çalıştırma, tek bir ajanın aynı anda sadece bir iş yapabilme ve uzmanlaşma eksikliği gibi zayıflıklarını gideriyor. Bu sayede, bir yandan ana problem çözülürken, diğer ajanlar dokümantasyon, kod kalitesi kontrolü veya özel alt görevler gibi alanlarda uzmanlaşabiliyor. Yazarın basit uygulaması, her ajan için ayrı bir git deposu ve Docker container kullanarak bu paralel yapıyı hayata geçiriyor. Bu deney, yapay zeka ajanlarının otonom ve karmaşık yazılım geliştirme süreçlerindeki potansiyelini gözler önüne seriyor.
Yapay zeka ajan takımları, insan müdahalesi olmadan sıfırdan karmaşık yazılımlar geliştirebilme yeteneğini kanıtladı.