Google on julkaissut uuden laaja-alaisen kielimallien perheen, Gemma 4:n, joka perustuu Gemini 3 -malliin. Gemma 4:ää jaetaan Apache-lisenssillä variantteina, joissa on 2.3, 4.5, 25.2 ja 30.7 miljardia parametria (E2B, E4B, 31B ja 26B A4B). E2B- ja E4B-variantit soveltuvat käytettäväksi mobiililaitteissa, esineiden internetissä (IoT) ja Raspberry Pi:n kaltaisissa piirilevyissä, kun taas muut variantit soveltuvat käytettäväksi työasemissa ja kuluttaja-GPU-järjestelmissä. Mallin käsittelemä kontekstin koko on 128 000 tokenia E2B- ja E4B-malleissa ja 256 000 tokenia 31B- ja 26B A4B-malleissa.
Mallit ovat monikielisiä ja multimodaalisia: ne tukevat 35 kieltä suoraan pakkauksesta (koulutuksessa käytettiin yli 140 kieltä), ja tekstiä ja kuvia voidaan käsitellä syötteenä (E2B- ja E4B-mallit tukevat lisäksi äänen käsittelyä). 26B A4B -malli perustuu Mixture-of-Experts (MoE) -arkkitehtuuriin, jossa malli on jaettu sarjaan asiantuntijaverkkoja (vastausten luomisessa voidaan käyttää vain 3.8 miljardia parametria, mutta nopeus on huomattavasti suurempi kuin klassisissa suurissa malleissa), kun taas muut variantit käyttävät klassista monoliittista arkkitehtuuria.
Mallit tukevat päättelyä ja mukautettavia harkintatiloja sekä järjestelmäroolia ohjeiden (sääntöjen, rajoitusten) käsittelyyn erillään datasta. Malleja voidaan käyttää koodin kirjoittamiseen, kuvien objektien tunnistamiseen, ruutu ruudulta -videoanalyysiin, dokumenttien ja PDF-tiedostojen jäsentämiseen, tulostetun ja käsin kirjoitetun tekstin optiseen tekstintunnistukseen (OCR), puheentunnistukseen ja kielten väliseen kääntämiseen. Niitä voidaan käyttää myös itsenäisinä agentteina, jotka ovat vuorovaikutuksessa erilaisten työkalujen ja API-rajapintojen kanssa.
Useimmissa testeissä Gemma 4 -mallit suoriutuivat merkittävästi paremmin kuin 27 miljardin parametrin Gemma 3 -malli. Gemma 4 tukee LiteRT-LM:ää, vLLM:ää, llama.cpp:tä, MLX:ää, Ollamaa, NVIDIA NIM:iä ja NeMo:ta, LM Studiota, Unslothia, SGLangia, Cactusta, Basetania, MaxTextiä, Tunixia ja Kerasia.


Lähde: opennet.ru
