Google het die oopbron Gemma 4 KI-model vrygestel, gebou op Gemini 3-tegnologie.

Google het 'n nuwe familie van grootskaalse taalmodelle, Gemma 4, gepubliseer, gebaseer op die Gemini 3-model. Gemma 4 word versprei onder die Apache-lisensie in variante met 2.3, 4.5, 25.2 en 30.7 miljard parameters (E2B, E4B, 31B en 26B A4B). Die E2B- en E4B-variante is geskik vir gebruik op mobiele toestelle, Internet of Things (IoT)-stelsels en Raspberry Pi-agtige borde, terwyl die ander variante geskik is vir gebruik op werkstasies en stelsels met verbruikers-GPU's. Die konteksgrootte wat deur die model oorweeg word, is 128 000 tokens vir die E2B- en E4B-modelle, en 256 000 tokens vir die 31B- en 26B A4B-modelle.

Die modelle is veeltalig en multimodaal: 35 tale word outomaties ondersteun (meer as 140 tale is tydens opleiding gebruik), en teks en beelde kan as invoer verwerk word (die E2B- en E4B-modelle ondersteun ook klankverwerking). Die 26B A4B-model is gebaseer op die Mixture-of-Experts (MoE)-argitektuur, waarin die model in 'n reeks kundigenetwerke verdeel is (responsgenerering kan slegs 3.8 miljard parameters gebruik, maar die spoed is aansienlik hoër as dié van klassieke groot modelle), terwyl die ander variante 'n klassieke monolitiese argitektuur gebruik.

Die modelle ondersteun redenasie- en aanpasbare beraadslagingsmodusse, en ondersteun 'n Stelselrol vir die verwerking van instruksies (reëls, beperkings) apart van data. Die modelle kan gebruik word vir die skryf van kode, die herkenning van voorwerpe in beelde, raam-vir-raam video-analise, die ontleding van dokumente en PDF's, optiese karakterherkenning (OCR) van gedrukte en handgeskrewe teks, spraakherkenning en vertaling tussen tale. Hulle kan ook gebruik word as outonome agente wat met verskeie gereedskap en API's interaksie het.

In die meeste toetse het Gemma 4-modelle die Gemma 3-model met 27 miljard parameters aansienlik oortref. Gemma 4 ondersteun LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM en NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix en Keras.

Google het die oopbron Gemma 4 KI-model vrygestel, gebou op Gemini 3-tegnologie.
Google het die oopbron Gemma 4 KI-model vrygestel, gebou op Gemini 3-tegnologie.


Bron: opennet.ru

Voeg 'n opmerking