Ana Sayfa

Databricks, Otomatik Sharder Dicer'ı Açık Kaynak Yaptı

1 dk okuma

Databricks, düşük gecikmeli, ölçeklenebilir ve yüksek güvenilirlikli parçalı (sharded) servisler oluşturmak için tasarlanmış kritik altyapı bileşenlerinden Dicer'ı açık kaynak olarak kullanıma sundu. Dicer, Databricks'in tüm ana ürünlerinin arkasında yer alarak, sürekli hızlı bir kullanıcı deneyimi sunarken filo verimliliğini artırıyor ve bulut maliyetlerini düşürüyor. Sistem, yeniden başlatmalar, arızalar ve değişen iş yükleri karşısında bile servislerin duyarlı ve esnek kalmasını sağlamak için sharding atamalarını dinamik olarak yönetiyor. Yüksek performanslı servisler, iş bölümleme, toplu işleme (batching) pipeline'ları, veri toplama, çoklu kiralama (multi-tenancy), yumuşak lider seçimi ve AI iş yükleri için verimli GPU kullanımı gibi çeşitli kullanım durumlarında başarıyla uygulanıyor.

Databricks mühendisleri, ölçeklenebilirlik sorunları nedeniyle başlangıçta kullandıkları durumsuz (stateless) modeller ve statik sharding teknikleriyle karşılaştıkları zorlukları aşmak için Dicer'ı geliştirdi. Durumsuz modeller, her istekte veritabanına erişim gerektirdiğinden yüksek maliyet ve gecikmeye yol açarken, uzaktan önbellek (remote cache) kullanımı bile temel verimsizlikleri çözemiyordu. Statik sharding ise servisler büyüdükçe yeniden dengeleme zorlukları, "hot shard" sorunları ve manuel müdahale ihtiyacı gibi kritik üretim sorunlarına neden oluyordu.

Dicer, durumu doğrudan üzerinde işlem yapan mantıkla birleştirerek (co-locating) bu katmanlı yükü ortadan kaldırıyor. Dinamik sharding yönetimi sayesinde, servislerin talebe göre otomatik olarak ölçeklenmesini ve kaynakların verimli kullanılmasını sağlıyor. Databricks, Dicer'ı açık kaynak yaparak, sektör ve akademi ile iş birliği içinde sağlam, verimli ve yüksek performanslı dağıtık sistemlerin geliştirilmesinde ilerlemeyi hedefliyor.

İçgörü

Dicer, Databricks'in kritik altyapı bileşenlerinden biri olarak, düşük gecikmeli, ölçeklenebilir ve yüksek güvenilirlikli parçalı servislerin oluşturulmasını kolaylaştırarak dağıtık sistemlerin gelişimine önemli bir katkı sunuyor.

Kaynak