Haber yayıncıları, yapay zeka (AI) şirketlerinin modellerini eğitmek için içeriklerini kazımasından duydukları endişeler nedeniyle Internet Archive'a erişimi kısıtlamaya başladı. Web'i koruma misyonuyla çalışan ve milyarlarca web sayfası anlık görüntüsünü barındıran Internet Archive'ın Wayback Machine ve API'leri, AI botları için cazip bir veri kaynağı haline geldi. Bu durum, bilgiye serbest erişim taahhüdüyle bilinen Internet Archive'ı, yayıncılar için potansiyel bir sorumluluk haline getiriyor. Yayıncılar, fikri mülkiyetlerini korumak amacıyla, AI şirketlerinin içeriklerine Internet Archive üzerinden ulaşmasını engellemeye çalışıyor.
The Guardian, erişim günlüklerini incelediğinde Internet Archive'ın sıkça içeriklerini taradığını fark etti ve bu nedenle proaktif adımlar attı. Yayıncı, Internet Archive'ın API'lerinden ve Wayback Machine'in URL arayüzünden makale sayfalarını filtreleyerek, AI şirketlerinin içeriklerini bu platform üzerinden kazıma ihtimalini minimize etti. Ancak ana sayfalar ve konu sayfaları gibi diğer bölümler erişilebilir kalmaya devam ediyor. Benzer şekilde, Financial Times da ücretli içeriklerini kazımaya çalışan OpenAI, Anthropic, Perplexity gibi AI botlarının yanı sıra Internet Archive botlarını da engelliyor. Uzmanlar, Internet Archive gibi "iyi niyetli" kuruluşların, yayıncıların büyük dil modelleri (LLM) tarafından kontrol edilmeme çabasında "istemeden zarar gören" taraf olduğunu belirtiyor. Özellikle Internet Archive'ın API'lerinin, AI şirketleri için yapılandırılmış ve kolayca erişilebilir bir veri kaynağı oluşturması endişeleri artırıyor.
Dijital arşivleme ve bilgiye erişim misyonuyla hareket eden Internet Archive'ın, yapay zeka çağında yayıncıların fikri mülkiyetini koruma çabalarıyla çatışması, bilgi paylaşımının geleceği hakkında önemli sorular ortaya çıkarıyor.