Büyük dil modelleri (LLM) geliştirme yarışında, birçok teknoloji şirketi telif hakkıyla korunan içerikleri sahiplerinden izin almadan eğitim verisi olarak kullandı. Bu şirketlerden biri olan Meta, 2023 yılında Richard Kadrey, Sarah Silverman ve Christopher Golden gibi tanınmış yazarlar tarafından toplu bir dava ile karşı karşıya kaldı. Davanın ilk aşamalarında Meta, Llama LLM'ini eğitmek için korsan kitapları kullanmasının adil kullanım (fair use) kapsamına girdiğine dair önemli bir zafer elde etti. Ancak bu, Meta'nın BitTorrent aracılığıyla kitapları indirme ve paylaşma eylemleri nedeniyle hala sorumlu olduğu "acı-tatlı" bir zaferdi.
Yazarlar, Meta'nın Anna's Archive gibi "gölge kütüphanelerden" kitapları BitTorrent ile indirmesinin, aynı zamanda bu kitapları diğer kullanıcılara yüklemesi anlamına geldiğini ve bunun doğrudan telif hakkı ihlali olduğunu iddia etti. Son gelişmelerle birlikte Meta, savunmasında yeni bir yön belirledi. Şirket, BitTorrent indirme süreci sırasında korsan kitapları diğer kullanıcılara yüklemenin de adil kullanım olarak nitelendirilmesi gerektiğini savundu. Meta'ya göre, BitTorrent protokolünün doğası gereği dosyaları indirirken otomatik olarak başkalarına da yükleme yapılır; bu bir seçim değil, teknolojinin işleyiş biçimidir.
Meta ayrıca, değerli (ancak korsan) verilere ulaşmak için BitTorrent paylaşımının bir zorunluluk olduğunu belirtti. Özellikle Anna's Archive'daki veri setlerinin toplu olarak yalnızca torrent indirmeleri aracılığıyla elde edilebildiğini ve bu durumun BitTorrent'i tek pratik seçenek haline getirdiğini vurguladı. Şirket, milyonlarca kitabı LLM eğitimi için adil kullanım amacıyla edinmenin, doğrudan indirmeyi gerektirdiğini ve bu indirme sürecinin ayrılmaz bir parçası olan yüklemenin de aynı adil kullanım amacına hizmet ettiğini iddia ediyor. Bu yeni savunma, telif hakkı ve yapay zeka arasındaki karmaşık ilişkiyi daha da derinleştiriyor.
Meta'nın BitTorrent üzerinden telifli içerik yüklemenin de adil kullanım sayılması gerektiği yönündeki savunması, yapay zeka modellerinin eğitiminde kullanılan veri kaynakları ve telif hakkı yasalarının geleceği için önemli bir emsal teşkil edebilir.