Free Law Project tarafından geliştirilen x-ray, PDF belgelerindeki hatalı karartmaları (redaction) tespit etmek için tasarlanmış açık kaynaklı bir Python kütüphanesidir. Yıllardır karşılaşılan yaygın bir soruna çözüm sunar: kullanıcılar hassas bilgileri gizlemek yerine, metnin üzerine sadece siyah bir dikdörtgen veya vurgu çizerler. Bu yöntem, alttaki metnin kolayca seçilip okunabilmesine olanak tanıyarak gizlilik ihlallerine yol açar. x-ray, bu tür "değersiz" karartmaları otomatik olarak belirleyerek, yasal belgeler ve diğer hassas içeriklerdeki güvenlik açıklarını ortaya çıkarmayı hedefler.
Kütüphane, bir PDF dosyasının yolunu veya URL'sini alarak çalışır ve hatalı karartmaların bulunduğu sayfa numaraları, bu karartmaların konumunu belirten sınırlayıcı kutular (bbox) ve karartmanın altındaki gizli metni içeren bir JSON çıktısı üretir. x-ray, uv veya pip ile kolayca kurulabilir ve hem komut satırı aracı olarak hem de bir Python modülü olarak kullanılabilir. Kullanıcılar, tek bir dosyayı veya xargs ile birden fazla URL'yi toplu olarak kontrol edebilirler.
x-ray şu anda Free Law Project'in milyonlarca belgesini analiz etmek için aktif olarak kullanılmaktadır. Geliştiriciler, kütüphanenin farklı türdeki hatalı karartmaları desteklemesi ve daha karmaşık senaryoları ele alması için topluluktan yardım beklemektedir. Bu araç, özellikle yasal, akademik veya kurumsal bağlamlarda PDF belgelerindeki gizlilik ve veri güvenliği standartlarını artırmak için önemli bir katkı sunmaktadır.
Bu araç, PDF belgelerindeki gizlilik ihlallerini ve veri sızıntılarını önlemek için kritik bir güvenlik açığını otomatik olarak tespit etme yeteneği sunar.