Makale, Vortex'in BtrBlocks'tan ilham alan kademeli sıkıştırma yaklaşımını anlatarak, Parquet+ZSTD'ye kıyasla hem daha küçük dosya boyutları hem de çok daha hızlı veri açma performansı sunduğunu açıklıyor. Geleneksel Parquet sıkıştırma yöntemleri, önce sözlük kodlama, delta kodlama veya bayt akışı bölme gibi hafif bir kodlama uygular, ardından ZSTD veya LZ4 gibi genel amaçlı bir sıkıştırma algoritması kullanır. Bu yaklaşım, sözlük boyutu büyüdüğünde veya belirli veri tipleri için alternatif kodlamalara geçiş yapsa da, temel olarak tek bir sabit kodlama yolu izler. En büyük dezavantajı ise ikinci katmandaki genel amaçlı sıkıştırmadır; ZSTD saniyede 1-2 GB hızında veri açarken, FastLanes gibi özel algoritmalar saniyede yüz milyarlarca tam sayıyı işleyebilir. Ayrıca, genel amaçlı sıkıştırma, tek bir değeri okumak için tüm bir sayfanın açılmasını gerektirerek rastgele erişimi ve push-down hesaplamayı ortadan kaldırır. Vortex ise "tek bir codec seçme, hepsini dene ve verinin karar vermesine izin ver" felsefesini benimser. Bu yaklaşım, birden fazla kodlamayı katmanlı bir şekilde birleştirerek veriye en uygun sıkıştırma stratejisini dinamik olarak belirler. TPC-H ölçek faktörü 10 testlerinde, Vortex dosyaları Parquet+ZSTD'ye göre %38 daha küçük olup, veri açma hızında 10-25 kat daha iyi performans gösteriyor. Bu başarı, genel amaçlı sıkıştırma algoritmaları kullanmadan, özel codec'lerin akıllıca seçimi ve birleşimi sayesinde elde ediliyor. Özellikle seyrek sorgular ve geç materyalizasyon gibi senaryolarda, hafif kodlanmış sütunlara doğrudan erişim, tüm sayfayı açma zorunluluğunu ortadan kaldırarak önemli performans avantajları sağlıyor.
Bu yeni sıkıştırma tekniği, büyük veri setlerinde depolama maliyetlerini düşürürken sorgu performansını dramatik şekilde artırarak veri analizi ve işleme süreçlerinde devrim yaratma potansiyeli taşıyor.