Vortex, sütunlu veri depolama için tasarlanmış, açık kaynaklı ve genişletilebilir yeni bir dosya formatıdır. Analitik dünyasında önemli bir yer tutan Parquet'in bazı tasarım kısıtlamalarına, özellikle de blok tabanlı sıkıştırma yapısına çözüm getirmeyi hedefler. Parquet'in aksine, Vortex verileri sıkıştırılmış haldeyken bile filtreleme ve diğer işlemleri gerçekleştirebilen "compute fonksiyonları" sunar. Bu sayede, verinin tamamını açmadan sorgu yürütme imkanı sağlayarak performans avantajı yaratır. SpiralDB ekibi tarafından geliştirilen ve Linux Foundation'a bağışlanan Vortex, farklı veri türleri ve hesaplama modelleri için optimize edilmiş düzenler ve kodlamalar (örneğin kayan nokta için ALP, metin için FSST) kullanır. Vortex'in en dikkat çekici özelliği, verinin kodlanmış düzenini bilerek sıkıştırılmış veri üzerinde rastgele ifadeleri çalıştırabilmesidir. Bu, veriyi açmadan filtreleme gibi işlemleri doğrudan depolama segmentleri içinde yürütmeye olanak tanır. Ayrıca, "late materialization" yaklaşımıyla sıkıştırmanın açılmasını CPU veya GPU'ya erteleyerek işlemci doygunluğunu artırır. FastLanes kodlaması bu özelliğin ana itici güçlerinden biridir. Format, dinamik olarak yüklenen kütüphaneleri destekleyerek yeni veri türleri ve özel hesaplama fonksiyonları için yeni kodlamalar sunabilir; hatta dosyaya WebAssembly kodunu gömerek özel hesaplama çekirdeklerinden faydalanma imkanı da sağlar. DuckDB, birçok farklı veri kaynağını sorgulamak için yaygın olarak kullanılan bir motor olarak öne çıkmaktadır. Yeni Vortex eklentisi sayesinde DuckDB, bu yenilikçi sütunlu formatla sorunsuz bir şekilde entegre olarak kullanıcılara daha hızlı ve verimli veri işleme deneyimi sunar. DataFusion, Spark ve Arrow gibi diğer veri işleme motorları da Vortex ile entegrasyon sunmaktadır, bu da formatın sektördeki kabulünü ve potansiyelini göstermektedir.
Vortex, veri analizi ve depolamada performansı önemli ölçüde artırarak, sıkıştırılmış veriler üzerinde doğrudan işlem yapma yeteneğiyle yeni nesil veri formatlarının öncüsü oluyor.