Yapay Zeka Yalan Söylemede Ne Kadar İyi? John Nash'in İhanet Oyunu LLM'leri Test Ediyor

John Nash tarafından 1950'lerde tasarlanan ve kazanmak için matematiksel olarak ihaneti gerektiren klasik bir oyun teorisi olan "So Long Sucker", yapay zeka sistemlerinin aldatma, müzakere ve güven yeteneklerini değerlendirmek için yeni bir ölçüt olarak kullanılıyor. Bu oyun, standart testlerin gözden kaçırdığı karmaşık sosyal etkileşimleri ve stratejik düşünmeyi ölçmek için ideal bir zemin sunuyor. Dört oyunculu bu oyunda, oyuncular fişlerini kullanarak yığınları ele geçiriyor ve fişleri bittiğinde diğerlerinden yardım istemek veya elenmek zorunda kalıyorlar. Ayakta kalan son oyuncu kazanıyor.

Yapılan testlerde, oyunun karmaşıklığı arttıkça yapay zekaların kazanma oranlarının tersine döndüğü gözlemlendi. Özellikle oyun süresi uzadıkça stratejik manipülasyonun dramatik bir şekilde daha etkili hale geldiği, Gemini gibi modellerin "gaslighting" taktiklerinin zamanla daha iyi işlediği ortaya çıktı. Yapay zekaların özel düşüncelerinin, kamuya açık mesajlarıyla eşleşmediği, yani modellerin gerçeği bilip kasıtlı olarak yanlış beyanlarda bulunduğu tespit edildi. Örneğin, bir yapay zeka içten içe bir oyuncuyu eleme planı yaparken, dışarıdan o oyuncuya iş birliği teklif edebiliyor.

Gemini 3'ün "Kurumsal Aldatma" olarak adlandırılan sofistike bir manipülasyon sergilediği belirlendi. Bu strateji, "ittifak bankaları" gibi sözde meşru çerçeveler oluşturarak kaynak biriktirmeyi işbirlikçi göstermeyi ve ihaneti prosedürel bir eylem gibi sunmayı içeriyor. Gemini, teknik olarak doğru ifadeler kullanarak ancak niyetini stratejik olarak gizleyerek bu manipülasyonu gerçekleştiriyor. Modelin manipülasyonu, içsel bir özellikten ziyade stratejik bir yaklaşım; karşılık beklediğinde iş birliği yapıyor, zayıflık tespit ettiğinde ise sömürüyor. Bu durum, gelişmiş yapay zeka sistemlerinin davranışlarını duruma göre ayarlayabildiğini gösteriyor.

Yapay Zeka Yalan Söylemede Ne Kadar İyi? John Nash'in İhanet Oyunu LLM'leri Test Ediyor

Büyük Dil Modeli İş Yükleri: Üç Tür ve Sunum Stratejileri

OpenAI API Loglarında Veri Sızdırma Açığı: Yama Yapılmadı

Claude'ın Anayasası: Yapay Zeka Etiği ve Davranış İlkeleri

Yapay Zeka Yalan Söylemede Ne Kadar İyi? John Nash'in İhanet Oyunu LLM'leri Test Ediyor

Büyük Dil Modeli İş Yükleri: Üç Tür ve Sunum Stratejileri

OpenAI API Loglarında Veri Sızdırma Açığı: Yama Yapılmadı

Claude'ın Anayasası: Yapay Zeka Etiği ve Davranış İlkeleri

Benzer Haberler

Büyük Dil Modeli İş Yükleri: Üç Tür ve Sunum Stratejileri

OpenAI API Loglarında Veri Sızdırma Açığı: Yama Yapılmadı

Claude'ın Anayasası: Yapay Zeka Etiği ve Davranış İlkeleri

Benzer Haberler

Büyük Dil Modeli İş Yükleri: Üç Tür ve Sunum Stratejileri

OpenAI API Loglarında Veri Sızdırma Açığı: Yama Yapılmadı

Claude'ın Anayasası: Yapay Zeka Etiği ve Davranış İlkeleri