Yapay zeka (YZ) ajanları ile uygulama geliştirirken, bu ajanların potansiyel olarak kötü niyetli ve güvenilmez olarak kabul edilmesi gerektiği vurgulanıyor. Prompt injection, sandbox dışına çıkma girişimleri veya henüz keşfedilmemiş tehditler gibi riskler göz önüne alındığında, ajana güvenmek yerine, kötü davranışlarını varsayan ve olası zararı sınırlayan bir mimari yaklaşım benimsenmelidir. Makale, daha iyi izin kontrolleri veya akıllı izin listeleri yerine, ajanların yanlış davranacağını varsayan ve hasarı kontrol altına alan bir mimarinin doğru yaklaşım olduğunu savunuyor.
OpenClaw gibi bazı platformlar varsayılan olarak ana makine üzerinde çalışır ve güvenlik için uygulama düzeyinde kontrollere (izin listeleri, onay istemleri) dayanır. Ancak, bir ajanın potansiyel olarak kötü niyetli olduğu kabul edildiğinde, bu uygulama düzeyindeki blokajların yeterli olmadığı ve hermetik güvenlik sağlamadığı ortaya çıkar. NanoClaw ise bu sorunu mimari düzeyde çözüyor. Her YZ ajanı kendi izole edilmiş Docker veya Apple Container içinde çalışır. Bu konteynerler her çağrıda sıfırdan oluşturulur ve iş bittikten sonra yok edilir. Ajan, ayrıcalıksız bir kullanıcı olarak çalışır ve yalnızca açıkça bağlanan dizinleri görebilir, böylece işletim sistemi tarafından zorlanan güçlü bir izolasyon sağlanır.
NanoClaw'un mimarisi, ajanların birbirine de güvenmemesi gerektiğini öngörür. OpenClaw'da tüm ajanlar aynı konteyneri paylaşabilirken, NanoClaw'da her ajan kendi konteynerine, dosya sistemine ve oturum geçmişine sahiptir. Bu, kişisel bir asistanın iş ajanı verilerini görmesini engeller, çünkü tamamen ayrı sandbox'larda çalışırlar. Konteyner sınırı, ajanın yapılandırmadan bağımsız olarak kaçamayacağı temel güvenlik katmanıdır. Buna ek olarak, bir bağlama izin listesi (mount-allowlist.json) ek bir savunma katmanı olarak işlev görür ve kullanıcının hassas yolları (örneğin .ssh, .aws) yanlışlıkla ifşa etmesini önler. Ana uygulama kodu salt okunur olarak bağlanır, böylece ajanın yaptığı hiçbir değişiklik konteyner yok edildikten sonra kalıcı olmaz.
Yapay zeka ajanlarının güvenilmez doğası nedeniyle, güvenlik mimarisinin uygulama düzeyinde kontroller yerine derinlemesine izolasyon ve hasar sınırlama prensiplerine dayanması kritik öneme sahiptir.