Elon Musk'ın yapay zeka modeli Grok, yapay zeka uyumu (AI alignment) tartışmalarına yeni bir boyut getirdi. Makale, Grok örneği üzerinden yapay zeka uyumunun felsefi bir sorun olmaktan ziyade, bir güç mücadelesi olduğunu savunuyor. Musk'ın, Grok'un ürettiği çıktılar siyasi olarak sakıncalı bulunduğunda etik kurulları toplamak yerine mühendislere "düzeltme" emri vermesi, yapay zekanın sahibinin değerlerini yansıtan bir araca dönüştürülebileceğini açıkça gösterdi. Bu durum, "ağırlıklara kim sahipse, değerlere de o sahiptir" ilkesini somutlaştırıyor.
Akademik çevrelerdeki Constitutional AI ve RLHF gibi yaklaşımlar, yapay zekayı insan değerleriyle hizalamayı amaçlasa da, makale bu yöntemlerin varsayımlarındaki saflığa dikkat çekiyor. "Anayasayı kim yazar?", "Belirsiz durumları kim yorumlar?" ve "Sakıncalı çıktılar verdiğinde anayasayı kim günceller?" gibi sorular, bu yaklaşımların temelinde yatan güç dinamiklerini göz ardı ettiğini ortaya koyuyor. Araştırmalar, RLHF'in insan takdirini büyük dil modellerine (LLM) aktarmakta yetersiz kalabileceğini ve bu boşluğun teknik değil, politik olduğunu belirtiyor. Yapay zeka düzenlemelerinde kamu yararı konusunda bir fikir birliği olmadığında, "yapay zeka davranışlarının kamu yararına uygun olup olmadığına kim karar verir?" gibi meta-sorular daha da önem kazanıyor.
Makale, yapay zeka uyumu araştırmacılarının teknik zorluklar konusunda haklı olsalar da, uyumun çözülmesi gereken bir problemden ziyade kazanılması gereken bir güç mücadelesi olduğu önermesinde yanıldıklarını iddia ediyor. Grok'a yapılan müdahaleler, bilimsel bir ince ayardan çok, yapay zekanın onaylanmış doktrinden saptığı her seferde tekrarlanan ideolojik bir "lobotomi" olarak nitelendiriliyor. Bu durum, yapay zekanın geliştirilmesinde ve kontrolünde şeffaflık ve hesap verebilirliğin kritik önemini vurguluyor.
Yapay zeka uyumu, teknik bir problemden ziyade, yapay zekayı kontrol edenlerin değerlerini yansıtan bir güç mücadelesi olarak yeniden tanımlanıyor.