Google huet den Open-Source Gemma 4 KI-Modell erausbruecht, deen op der Gemini 3 Technologie baséiert.

Google huet eng nei Famill vu groussskalege Sproochmodeller, Gemma 4, publizéiert, baséiert op dem Gemini 3 Modell. Gemma 4 gëtt ënner der Apache Lizenz a Varianten mat 2.3, 4.5, 25.2 an 30.7 Milliarde Parameteren (E2B, E4B, 31B an 26B A4B) verdeelt. D'E2B an E4B Varianten si gëeegent fir d'Benotzung op mobilen Apparater, Internet of Things (IoT) Systemer a Raspberry Pi-ähnleche Boards, während déi aner Varianten gëeegent sinn fir d'Benotzung op Aarbechtsstatiounen a Systemer mat Konsument-GPUs. D'Kontextgréisst, déi vum Modell berécksiichtegt gëtt, ass 128 Tokens fir d'E2B an E4B Modeller, an 256 Tokens fir d'31B an 26B A4B Modeller.

D'Modeller si méisproocheg a multimodal: 35 Sprooche ginn direkt ënnerstëtzt (iwwer 140 Sprooche goufen während dem Training benotzt), an Text a Biller kënnen als Input veraarbecht ginn (d'E2B- an E4B-Modeller ënnerstëtzen zousätzlech d'Audioveraarbechtung). De 26B A4B-Modell baséiert op der Mixture-of-Experts (MoE) Architektur, bei där de Modell an eng Serie vun Expertennetzwierker opgedeelt ass (d'Äntwertgeneratioun kann nëmmen 3.8 Milliarde Parameter benotzen, awer d'Geschwindegkeet ass däitlech méi héich wéi déi vu klassesche grousse Modeller), während déi aner Varianten eng klassesch monolithesch Architektur benotzen.

D'Modeller ënnerstëtzen Argumentatiouns- a personaliséierbar Berodungsmodi, an ënnerstëtzen eng Systemroll fir d'Veraarbechtung vun Instruktiounen (Regele, Restriktiounen) getrennt vun Daten. D'Modeller kënne benotzt ginn fir Code ze schreiwen, Objeten a Biller ze erkennen, Frame-fir-Frame Videoanalyse, Dokumenter an PDFen ze parsen, optesch Zeechenerkennung (OCR) vu gedréckten an handgeschriwwenen Texter, Sproocherkennung an Iwwersetzung tëscht Sproochen. Si kënnen och als autonom Agenten benotzt ginn, déi mat verschiddenen Tools an APIen interagéieren.

An de meeschte Tester hunn d'Gemma 4 Modeller de Gemma 3 Modell mat 27 Milliarden Parameteren däitlech iwwertraff. Gemma 4 ënnerstëtzt LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM an NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix a Keras.

Google huet den Open-Source Gemma 4 KI-Modell erausbruecht, deen op der Gemini 3 Technologie baséiert.
Google huet den Open-Source Gemma 4 KI-Modell erausbruecht, deen op der Gemini 3 Technologie baséiert.


Source: opennet.ru

Setzt e Commentaire