Ana Sayfa

GPU Destekli Cuckoo Filtre ile Veri İşlemlerinde Rekor Hız

1 dk okuma

Bu makale, "Design and Evaluation of a GPU-Accelerated Cuckoo Filter" tezinin bir parçası olarak geliştirilen, yüksek performanslı bir CUDA Cuckoo Filter uygulamasını tanıtıyor. Cuckoo Filter'lar, yapısal olarak bellek açısından verimli, olasılıksal veri yapılarıdır ve yapılandırılabilir bir yanlış pozitif oranıyla ekleme, arama ve silme işlemlerini destekler. Bu kütüphane, özellikle yüksek verimli toplu (batch) işlemler için optimize edilmiş, GPU hızlandırmalı bir Cuckoo Filter sunarak modern veri işleme ihtiyaçlarına güçlü bir çözüm getiriyor.

Kütüphane, CUDA hızlandırmalı toplu ekleme, arama ve silme operasyonları gibi bir dizi önemli özellik sunar. Kullanıcılar, parmak izi boyutu (fingerprint size) ve kova boyutu (bucket size) gibi parametreleri yapılandırabilir, ayrıca farklı tahliye politikaları (DFS, BFS) arasından seçim yapabilirler. Bellek birleşmesini (memory coalescing) iyileştirmek için sıralı ekleme modu, çoklu GPU desteği (gossip aracılığıyla) ve süreçler arası filtre paylaşımı için IPC desteği de mevcuttur. Kütüphanenin başlık-sadece (header-only) tasarımı, entegrasyonu kolaylaştırır ve geliştiricilere esneklik sağlar.

NVIDIA GH200 (H100 HBM3) üzerinde %80 yük faktörüyle yapılan karşılaştırmalı testler, bu GPU Cuckoo Filter'ın üstün performansını açıkça ortaya koyuyor. CPU Cuckoo Filter'a kıyasla ekleme işlemlerinde 360 ila 583 kat, arama işlemlerinde ise 973 ila 1504 kat daha hızlı olduğu gözlemlenmiştir. Ayrıca, Bulk Two-Choice Filter (TCF) ve GPU Counting Quotient Filter (GQF) gibi diğer GPU tabanlı filtrelerle karşılaştırıldığında da önemli ölçüde daha hızlı performans sergiliyor. Bu sonuçlar, büyük ölçekli ve yüksek performans gerektiren veri filtreleme uygulamaları için GPU Cuckoo Filter'ın ne kadar değerli bir araç olduğunu kanıtlıyor.

İçgörü

Bu GPU destekli Cuckoo Filter, büyük veri setlerinde üyelik kontrolü ve filtreleme işlemlerini CPU tabanlı çözümlere göre yüzlerce kat hızlandırarak, gerçek zamanlı ve yüksek hacimli veri işleme uygulamaları için kritik bir performans artışı sunuyor.

Kaynak