Google, Gemini 3 modelinə əsaslanan yeni bir genişmiqyaslı dil modelləri ailəsi olan Gemma 4-ü nəşr etdi. Gemma 4, Apache Lisenziyası altında 2.3, 4.5, 25.2 və 30.7 milyard parametrli (E2B, E4B, 31B və 26B A4B) variantlarda paylanır. E2B və E4B variantları mobil cihazlarda, Əşyaların İnterneti (IoT) sistemlərində və Raspberry Pi kimi lövhələrdə istifadə üçün uyğundur, digər variantlar isə iş stansiyalarında və istehlakçı GPU-ları olan sistemlərdə istifadə üçün uyğundur. Model tərəfindən nəzərdən keçirilən kontekst ölçüsü E2B və E4B modelləri üçün 128 token, 31B və 26B A4B modelləri üçün isə 256 tokendir.
Modellər çoxdilli və multimodaldır: 35 dil standart olaraq dəstəklənir (təlim zamanı 140-dan çox dil istifadə edilmişdir) və mətn və şəkillər giriş kimi emal edilə bilər (E2B və E4B modelləri əlavə olaraq səs emalını dəstəkləyir). 26B A4B modeli, modelin bir sıra ekspert şəbəkələrinə bölündüyü (cavab generasiyası yalnız 3.8 milyard parametrdən istifadə edə bilər, lakin sürət klassik böyük modellərdən xeyli yüksəkdir), digər variantlar isə klassik monolit arxitekturadan istifadə edir.
Modellər mühakimə yürütmə və fərdiləşdirilə bilən müzakirə rejimlərini dəstəkləyir və təlimatları (qaydaları, məhdudiyyətləri) məlumatlardan ayrıca emal etmək üçün Sistem Rolunu dəstəkləyir. Modellər kod yazmaq, şəkillərdəki obyektləri tanımaq, kadr-kadr video təhlili, sənədləri və PDF-ləri təhlil etmək, çap olunmuş və əlyazma mətnlərin optik simvol tanıması (OCR), nitq tanıma və dillər arasında tərcümə üçün istifadə edilə bilər. Onlar həmçinin müxtəlif alətlər və API-lərlə qarşılıqlı əlaqədə olan muxtar agentlər kimi istifadə edilə bilər.
Əksər sınaqlarda Gemma 4 modelləri 27 milyard parametrli Gemma 3 modelindən əhəmiyyətli dərəcədə üstün idi. Gemma 4 LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM və NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix və Keras-ı dəstəkləyir.


Mənbə: opennet.ru
