Alibaba'nın yapay zeka birimi Qwen, fotoğrafları ayrı, düzenlenebilir bileşenlere ayıran yeni bir görsel düzenleme modeli olan Qwen-Image-Layered'ı piyasaya sürdü. Bu model, görselleri şeffaf arka planlara sahip birden fazla bireysel katmana (RGBA katmanları) bölerek, kullanıcıların her katmanı görselin geri kalanını etkilemeden bağımsız olarak düzenlemesine olanak tanıyor. Bu yenilik, standart görseller ile yapılandırılmış, düzenlenebilir temsiller arasında bir köprü kurmayı hedefliyor.
Qwen-Image-Layered, bireysel öğelerin boyutunu değiştirme, yeniden konumlandırma ve yeniden renklendirme gibi basit düzenlemeleri kolayca yapabiliyor. Kullanıcılar arka planları değiştirebilir, insanları yer değiştirebilir, metinleri düzenleyebilir veya nesneleri silebilir, taşıyabilir ve büyütebilirler. Görseller 3 veya 8 katmana ayrılabilir ve bu süreç tekrarlanabilir; yani her katman gerektiğinde ek katmanlara bölünebilir. Bu esneklik, görsel düzenleme süreçlerinde önemli bir verimlilik artışı sağlıyor ve karmaşık manipülasyonları basitleştiriyor.
Qwen ekibi, modelin kodunu GitHub'da yayınladı ve modeller Hugging Face ile ModelScope platformlarında erişilebilir durumda. Daha fazla ayrıntı blog yazısında ve teknik raporda bulunabilirken, uygulamalı testler için Hugging Face ve ModelScope'da demolar mevcut. Bu açık kaynak yaklaşımı, geliştiricilerin ve araştırmacıların modeli daha da geliştirmesine ve farklı uygulamalara entegre etmesine olanak tanıyor.
Bu model, görsel düzenleme yazılımlarının karmaşıklığını azaltarak yapay zeka destekli, katmanlı düzenleme yeteneklerini geniş kitlelere ulaştırıyor ve yaratıcı süreçleri demokratikleştiriyor.