Google, Gemini 3 modeline dayalı yeni bir büyük ölçekli dil modeli ailesi olan Gemma 4'ü yayınladı. Gemma 4, 2.3, 4.5, 25.2 ve 30.7 milyar parametreye sahip varyantlar (E2B, E4B, 31B ve 26B A4B) ile Apache Lisansı altında dağıtılıyor. E2B ve E4B varyantları mobil cihazlarda, Nesnelerin İnterneti (IoT) sistemlerinde ve Raspberry Pi benzeri kartlarda kullanım için uygunken, diğer varyantlar iş istasyonlarında ve tüketici GPU'lu sistemlerde kullanım için uygundur. Model tarafından dikkate alınan bağlam boyutu, E2B ve E4B modelleri için 128 belirteç, 31B ve 26B A4B modelleri için ise 256 belirteçtir.
Modeller çok dilli ve çok modludur: 35 dil varsayılan olarak desteklenir (eğitim sırasında 140'tan fazla dil kullanılmıştır) ve metin ve görüntüler girdi olarak işlenebilir (E2B ve E4B modelleri ayrıca ses işlemeyi de destekler). 26B A4B modeli, modelin bir dizi uzman ağına bölündüğü Uzmanlar Karışımı (MoE) mimarisine dayanır (yanıt üretimi yalnızca 3.8 milyar parametre kullanabilir, ancak hızı klasik büyük modellerden önemli ölçüde daha yüksektir), diğer varyantlar ise klasik monolitik bir mimari kullanır.
Modeller, akıl yürütmeyi ve özelleştirilebilir değerlendirme modlarını destekler ve talimatları (kurallar, kısıtlamalar) verilerden ayrı olarak işlemek için bir Sistem Rolü sunar. Modeller, kod yazma, görüntülerdeki nesneleri tanıma, kare kare video analizi, belge ve PDF ayrıştırma, basılı ve el yazısı metinlerin optik karakter tanıma (OCR) işlemi, konuşma tanıma ve diller arası çeviri için kullanılabilir. Ayrıca çeşitli araçlar ve API'lerle etkileşim kuran otonom ajanlar olarak da kullanılabilirler.
Çoğu testte, Gemma 4 modelleri 27 milyar parametreli Gemma 3 modelinden önemli ölçüde daha iyi performans gösterdi. Gemma 4, LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM ve NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix ve Keras'ı desteklemektedir.


Kaynak: opennet.ru
