Společnost Google publikovala novou rodinu rozsáhlých jazykových modelů Gemma 4, založených na modelu Gemini 3. Gemma 4 je distribuována pod licencí Apache ve variantách s 2.3, 4.5, 25.2 a 30.7 miliardami parametrů (E2B, E4B, 31B a 26B A4B). Varianty E2B a E4B jsou vhodné pro použití na mobilních zařízeních, systémech internetu věcí (IoT) a deskách podobných Raspberry Pi, zatímco ostatní varianty jsou vhodné pro použití na pracovních stanicích a systémech se spotřebitelskými grafickými procesory. Velikost kontextu, kterou model zohledňuje, je 128 000 tokenů pro modely E2B a E4B a 256 000 tokenů pro modely 31B a 26B A4B.
Modely jsou vícejazyčné a multimodální: ihned po instalaci je podporováno 35 jazyků (během tréninku bylo použito přes 140 jazyků) a jako vstup lze zpracovávat text a obrázky (modely E2B a E4B navíc podporují zpracování zvuku). Model 26B A4B je založen na architektuře Mixture-of-Experts (MoE), ve které je model rozdělen do řady expertních sítí (generování odpovědí může využít pouze 3.8 miliardy parametrů, ale rychlost je výrazně vyšší než u klasických velkých modelů), zatímco ostatní varianty používají klasickou monolitickou architekturu.
Modely podporují uvažování a přizpůsobitelné režimy deliberace a podporují systémovou roli pro zpracování instrukcí (pravidel, omezení) odděleně od dat. Modely lze použít pro psaní kódu, rozpoznávání objektů v obrazech, analýzu videa po jednotlivých snímcích, parsování dokumentů a PDF, optické rozpoznávání znaků (OCR) tištěného a ručně psaného textu, rozpoznávání řeči a překlad mezi jazyky. Mohou být také použity jako autonomní agenti interagující s různými nástroji a API.
Ve většině testů modely Gemma 4 výrazně překonaly model Gemma 3 s 27 miliardami parametrů. Gemma 4 podporuje LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM a NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix a Keras.


Zdroj: opennet.ru
