Meta, ses düzenleme alanında çığır açan yeni yapay zeka modeli SAM Audio'yu tanıttı. Bu model, karmaşık ses karışımlarından istenilen sesleri kolayca ayırmayı mümkün kılıyor. Örneğin, bir konserde gitarı veya vokalleri tek bir tıklamayla izole edebilir, dış çekim bir videodaki trafik gürültüsünü metin komutlarıyla filtreleyebilir veya bir podcast kaydındaki köpek havlamasını kaldırabilirsiniz. Segment Anything koleksiyonunun en yeni üyesi SAM Audio, metin, görsel ve zaman aralığı komutlarını kullanarak ses işlemeyi dönüştürüyor.
Bu sezgisel yaklaşım, insanların sesle doğal olarak etkileşim kurma şeklini yansıtarak profesyonel düzeyde ses ayrımını her zamankinden daha erişilebilir hale getiriyor. SAM Audio, ses ve video düzenlemesini dönüştürme potansiyeline sahip olup müzik, podcast yayıncılığı, televizyon, film, bilimsel araştırma ve erişilebilirlik gibi alanlarda yenilikleri tetikleyebilir. Şimdiye kadar ses segmentasyonu ve düzenlemesi, tek amaçlı araçlarla parçalı bir alandı. SAM Audio, insanların ses hakkında doğal olarak düşündüğü kullanım durumlarını destekleyen ilk birleşik modeldir ve gerçek dünya senaryolarında üstün performans sergiler.
Model, üç tür komut istemini destekliyor: "köpek havlaması" veya "şarkı söyleyen ses" gibi metin komutları; videodaki ses çıkaran kişiye veya nesneye tıklayarak görsel komutlar; ve hedef sesin oluştuğu zaman dilimlerini işaretlemenizi sağlayan sektörde bir ilk olan zaman aralığı komutları. Bu yöntemler tek başına veya herhangi bir kombinasyonda kullanılarak sesin nasıl ayrılacağı konusunda hassas ve sezgisel kontrol sağlıyor. SAM Audio'yu, yeni modelleri denemek için tasarlanmış Segment Anything Playground platformunda deneyebilir veya modeli indirebilirsiniz.
Meta'nın yeni yapay zeka modeli SAM Audio, ses düzenleme süreçlerini basitleştirerek profesyonel düzeyde ses ayrımını herkes için erişilebilir kılıyor ve yaratıcı endüstrilerde büyük bir dönüşüm vadediyor.