A Google közzétett egy új, nagyméretű nyelvi modellekből álló családot, a Gemma 4-et, amely a Gemini 3 modellen alapul. A Gemma 4 az Apache licenc alatt, 2.3, 4.5, 25.2 és 30.7 milliárd paraméterrel rendelkező variánsokban (E2B, E4B, 31B és 26B A4B) kerül forgalomba. Az E2B és E4B variánsok mobileszközökön, dolgok internetén (IoT) alapuló rendszereken és Raspberry Pi-szerű alaplapokon való használatra alkalmasak, míg a többi variáns munkaállomásokon és fogyasztói GPU-kkal rendelkező rendszereken való használatra alkalmas. A modell által figyelembe vett kontextusméret 128 000 token az E2B és E4B modellek esetében, valamint 256 000 token a 31B és 26B A4B modellek esetében.
A modellek többnyelvűek és multimodálisak: 35 nyelvet támogatnak alapértelmezés szerint (a betanítás során több mint 140 nyelvet használtak), és szöveg, valamint képek is feldolgozhatók bemenetként (az E2B és E4B modellek emellett a hangfeldolgozást is támogatják). A 26B A4B modell a Mixture-of-Experts (MoE) architektúrán alapul, amelyben a modell szakértői hálózatok sorozatára van osztva (a válaszgenerálás csak 3.8 milliárd paramétert használhat, de a sebesség jelentősen nagyobb, mint a klasszikus nagy modelleké), míg a többi változat klasszikus monolitikus architektúrát használ.
A modellek támogatják az érvelést és a testreszabható mérlegelési módokat, valamint egy rendszerszerepkört az utasítások (szabályok, megszorítások) adatoktól elkülönített feldolgozásához. A modellek használhatók kódírásra, képeken lévő objektumok felismerésére, képkockánkénti videóelemzésre, dokumentumok és PDF-ek elemzésére, nyomtatott és kézzel írott szöveg optikai karakterfelismerésére (OCR), beszédfelismerésre és nyelvek közötti fordításra. Autonóm ágensként is használhatók, amelyek különféle eszközökkel és API-kkal kommunikálnak.
A legtöbb tesztben a Gemma 4 modellek jelentősen felülmúlták a 27 milliárd paraméteres Gemma 3 modellt. A Gemma 4 támogatja a LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM és NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix és Keras programokat.


Forrás: opennet.ru
