Google, Gemini 3 serisinin en hızlı ve en uygun maliyetli modeli olan Gemini 3.1 Flash-Lite'ı tanıttı. Yüksek hacimli geliştirici iş yükleri için tasarlanan bu yeni model, fiyatına ve model katmanına göre yüksek kalite sunuyor. Bugün itibarıyla, geliştiriciler için Gemini API aracılığıyla Google AI Studio'da ve kurumsal müşteriler için Vertex AI üzerinden önizleme olarak kullanıma sunuluyor. Modelin giriş token'ları için 1 milyon başına 0.25 dolar, çıkış token'ları için ise 1 milyon başına 1.50 dolar gibi rekabetçi bir fiyatlandırması bulunuyor.
3.1 Flash-Lite, daha büyük modellere kıyasla çok daha düşük maliyetle gelişmiş performans sağlıyor. Yapay Analiz kıyaslamalarına göre, 2.5 Flash'tan 2.5 kat daha hızlı ilk yanıt token süresi ve %45 daha yüksek çıkış hızı sunarken, benzer veya daha iyi kaliteyi koruyor. Bu düşük gecikme süresi, yüksek frekanslı iş akışları için kritik öneme sahip olup, geliştiricilerin duyarlı, gerçek zamanlı deneyimler oluşturması için ideal bir model haline getiriyor. Model, Arena.ai Liderlik Tablosu'nda 1432 Elo puanı alarak, kendi seviyesindeki diğer modelleri ve hatta önceki nesil Gemini modellerini geride bırakıyor.
Modelin ham performansının ötesinde, Gemini 3.1 Flash-Lite, AI Studio ve Vertex AI'da standart olarak "düşünme seviyeleri" ile birlikte geliyor. Bu özellik, geliştiricilere modelin bir görev için ne kadar "düşüneceğini" seçme esnekliği sunarak yüksek frekanslı iş yüklerini yönetmede kritik bir kontrol sağlıyor. 3.1 Flash-Lite, maliyetin öncelikli olduğu yüksek hacimli çeviri ve içerik denetimi gibi görevleri ölçekli bir şekilde ele alabiliyor. Ayrıca, kullanıcı arayüzleri ve panolar oluşturma, simülasyonlar yapma veya karmaşık talimatları takip etme gibi daha derinlemesine muhakeme gerektiren karmaşık iş yüklerinin de üstesinden gelebiliyor. Erken erişimdeki geliştiriciler, modelin verimliliğini, muhakeme yeteneklerini ve karmaşık girdileri hassasiyetle işleyebildiğini vurguluyorlar.
Gemini 3.1 Flash-Lite, geliştiricilere maliyet etkinliği ve yüksek performans sunarak yapay zeka uygulamalarını geniş ölçekte ve gerçek zamanlı olarak hayata geçirme imkanı tanıyor.