Ana Sayfa

Anthropic'ten Sorumlu Ölçeklendirme Politikası'na Yeni Sürüm: RSP 3.0

1 dk okuma

Anthropic, yapay zeka sistemlerinden kaynaklanabilecek felaket risklerini azaltmak amacıyla geliştirdiği gönüllü çerçeve olan Sorumlu Ölçeklendirme Politikası'nın (RSP) üçüncü versiyonunu yayınladı. İki yılı aşkın süredir uygulanan RSP'nin faydaları ve eksikliklerinden elde edilen derslerle güncellenen bu politika, başarılı uygulamaları pekiştirirken, gerekli iyileştirmeleri ve karar alma süreçlerinin şeffaflığını artıracak yeni önlemleri içeriyor. Orijinal RSP, hızla ilerleyen yapay zeka teknolojisinin henüz mevcut olmayan ancak hızla ortaya çıkabilecek risklerini ele alma amacı taşıyordu.

Politika, modeller belirli yetenek seviyelerini (örneğin, tehlikeli silahların oluşturulmasına yardımcı olabilecek biyolojik bilim yetenekleri) aştığında, daha sıkı güvenlik önlemlerinin (modelin kötüye kullanımına ve ağırlıklarının çalınmasına karşı) devreye sokulmasını öngören koşullu taahhütlere odaklanıyordu. Her bir güvenlik önlemi seti, bir "Yapay Zeka Güvenlik Seviyesi" (ASL) ile ilişkilendirildi; örneğin, ASL-2 bir dizi önlemi, ASL-3 ise daha yetenekli modeller için daha katı önlemleri ifade ediyordu. İlk ASL'ler (ASL-2 ve ASL-3) detaylıca tanımlanırken, gelecekteki daha yüksek yetenek seviyeleri için ASL-4 ve sonrası bilinçli olarak daha az tanımlanmış bırakılmıştı.

Anthropic'in bu politikayla ulaşmayı hedeflediği "değişim teorisi" iki ana mekanizmaya dayanıyor. Birincisi, şirket içinde yeni modellerin piyasaya sürülmesi ve eğitilmesi için önemli güvenlik önlemlerinin zorunlu hale getirilmesiyle iç bir itici güç oluşturmak. Bu, güvenlik önlemlerinin önemini vurgulayarak daha hızlı ilerlemeyi teşvik ediyor. İkincisi ise, RSP'yi duyurarak diğer yapay zeka şirketlerini de benzer politikalar benimsemeye teşvik etmek ve böylece sektörde "zirveye doğru bir yarış" başlatarak genel güvenlik duruşunu güçlendirmek.

İçgörü

Anthropic'in güncellenmiş Sorumlu Ölçeklendirme Politikası, yapay zeka teknolojilerinin hızla gelişen yeteneklerine paralel olarak ortaya çıkan riskleri proaktif bir şekilde yönetme ve sektör genelinde güvenlik standartlarını yükseltme çabasını gösteriyor.

Kaynak