Ana Sayfa

Zpdf: Zig ile MuPDF'ten Çok Daha Hızlı PDF Metin Çıkarma

1 dk okuma

Zpdf, Zig programlama diliyle yazılmış, yüksek performanslı bir PDF metin çıkarma kütüphanesidir. Özellikle büyük PDF dosyalarıyla çalışırken verimlilik sağlamak amacıyla tasarlanmıştır. Bellek eşlemeli dosya okuma özelliği sayesinde, büyük dosyaları işlerken kaynak kullanımını optimize ederken, ara bellek tahsisatı yapmadan doğrudan akış şeklinde metin çıkarımı gerçekleştirebilir. Kütüphane, FlateDecode, ASCII85, ASCIIHex, LZW ve RunLength gibi çeşitli sıkıştırma filtrelerini desteklemenin yanı sıra, WinAnsi, MacRoman ve ToUnicode CMap gibi farklı yazı tipi kodlamalarını da başarıyla işleyebilir. Ayrıca, PDF 1.5 ve üzeri sürümlerdeki XRef tablolarını ve akışlarını ayrıştırabilir, esnek hata işleme seçenekleri sunar.

Zpdf'in en dikkat çekici özelliklerinden biri, çoklu iş parçacığı kullanarak sayfaları paralel olarak işleyebilmesidir. Bu mimari yaklaşım, MuPDF gibi tek iş parçacıklı metin çıkarma araçlarına kıyasla önemli bir hız avantajı sağlar. Yapılan performans testlerinde, Zpdf'in MuPDF'e göre 2.7 kattan 18 kata kadar daha hızlı olduğu gözlemlenmiştir; genel olarak 5 katlık bir hızlanma sunmaktadır. Örneğin, Intel SDM belgesinde saniyede 41.000 sayfa gibi etkileyici bir zirve verimliliğine ulaşabilmektedir.

Kütüphane, hem bir Zig projesi içinde kolayca entegre edilebilir hem de komut satırı aracı (CLI) olarak kullanılabilir. Kullanıcılar, zpdf extract komutuyla tüm sayfaları veya belirli sayfa aralıklarını çıkarabilir, zpdf info ile belge bilgilerini görüntüleyebilir veya zpdf bench ile performans testleri yapabilirler. Bu özellikler, Zpdf'i hem geliştiriciler hem de hızlı ve verimli PDF metin çıkarımına ihtiyaç duyan son kullanıcılar için güçlü bir çözüm haline getirmektedir.

İçgörü

Zpdf, Zig dilinin performans avantajlarını kullanarak PDF metin çıkarımında mevcut çözümlerden çok daha hızlı ve verimli bir alternatif sunuyor.

Kaynak