Google, Gemma 3 model ailesini temel alan, son teknoloji ürünü ve hafif açık çeviri modelleri serisi olan TranslateGemma'yı tanıttı. Bu modeller, 55 farklı dilde çeviri görevlerini yerine getirmek üzere tasarlanmıştır. Görece küçük boyutları sayesinde, dizüstü bilgisayarlar, masaüstü bilgisayarlar veya kişisel bulut altyapıları gibi sınırlı kaynaklara sahip ortamlarda kolayca dağıtılabilirler. Bu özellik, modern çeviri modellerine erişimi demokratikleştirerek herkes için inovasyonu teşvik etmeyi amaçlamaktadır.
TranslateGemma modelleri, metin dizeleri ve görüntüler gibi çeşitli girdileri işleyebilir. Metin girdileri doğrudan çevrilirken, görüntüler 896x896 çözünürlüğe normalize edilip 256 tokene kodlandıktan sonra metin çıkarımı ve çevirisi için kullanılır. Toplam girdi bağlamı 2K tokena kadar çıkabilir. Çıktı olarak ise hedef dile çevrilmiş metin sunulur.
Modelin kullanımı, Hugging Face transformers'ın sohbet şablonlama sistemiyle uyumlu özel bir sohbet şablonu üzerinden gerçekleştirilir. Bu şablon, doğrudan metin çevirisini veya görüntüden metin çıkarma ve çevirisini destekler. Kullanıcı rolü, "type" (metin veya görüntü), "source_lang_code" ve "target_lang_code" gibi belirli özelliklerin sağlanmasını gerektiren özel bir yapıya sahiptir. Dil kodları, ISO 639-1 Alpha-2 formatında (örn. "en") veya bölgesel varyantlar (örn. "en_US") olarak belirtilebilir. Bu esneklik, geniş bir kullanım yelpazesi sunar.
Bu model, gelişmiş çeviri teknolojilerini daha geniş bir kullanıcı kitlesine ulaştırarak dil bariyerlerini aşmada önemli bir adım atıyor ve kaynak kısıtlı ortamlarda bile yüksek performanslı çeviri imkanı sunuyor.