Ana Sayfa

Claude Nedir? Anthropic Bile Yanıtı Bilmiyor

1 dk okuma

Büyük dil modelleri (LLM'ler), kelimeleri sayılara dönüştüren, bu sayıları karmaşık bir matematiksel süreçten geçiren ve sonuçları tekrar kelimelere çeviren devasa sayı yığınlarından ibarettir. Meteorologların hava durumu veya epidemiyologların hastalık yollarını tahmin etmek için kullandığı benzer modeller genellikle yoğun duygulara yol açmazken, yapay zeka sistemlerinin cümleleri tahmin etmeye başlaması, yani "konuşması", geniş çaplı bir şaşkınlık ve hatta delilikle karşılandı. Dilin insanlığa özgü bir yetenek olduğu düşünülürken, konuşan makinelerin ortaya çıkışı bu algıyı temelden sarstı.

Bilgisayar bilimcisi Ellie Pavlick, LLM'lere verilen tepkileri "fanboylar" (yapay zekanın zeki, hatta bilinçli olduğuna inananlar) ve "huysuzlar" (sadece bir salon numarası olduğunu iddia edenler) olarak ikiye ayırıyor. Ancak Pavlick, "bilmemenin de bir tepki biçimi olduğunu" öne sürüyor. Temel olarak, büyük dil modelleri birer kara kutudur; nasıl çalıştıklarını tam olarak anlamıyoruz. Onlara zeki veya bilinçli demenin mantıklı olup olmadığını da bilmiyoruz. Pavlick'in daha derin noktası ise, konuşan makinelerin varlığının, kendi zihinlerimizi ve "zeka" kavramını ne kadar anladığımız gibi birçok şeyi de sorgulatmasıdır.

Bu belirsizlik ortamında, LLM'ler hakkında makul bir şekilde ne söyleyebileceğimizi keşfetmek için yeni bir bilimsel alan ortaya çıktı: "yorumlanabilirlik" (interpretability). Bu disiplin, yapay zeka sistemlerine, bir zamanlar insan zihnini incelemek için ayrılmış bir incelikle yaklaşıyor. Anthropic gibi "sınır laboratuvarları", bu yeni haritacılığın sinir merkezini oluşturuyor ve kara kutuların içindeki kara kutuları anlamaya çalışıyor.

İçgörü

Büyük dil modellerinin nasıl çalıştığına dair derin bir belirsizlik bulunması, yapay zeka araştırmalarında yeni bir bilimsel alanın, 'yorumlanabilirlik'in, ortaya çıkmasına neden oluyor.

Kaynak