Spoločnosť Google vydala open source model umelej inteligencie Gemma 4, postavený na technológii Gemini 3.

Spoločnosť Google zverejnila novú rodinu rozsiahlych jazykových modelov Gemma 4, založených na modeli Gemini 3. Gemma 4 je distribuovaná pod licenciou Apache vo variantoch s 2.3, 4.5, 25.2 a 30.7 miliardami parametrov (E2B, E4B, 31B a 26B A4B). Varianty E2B a E4B sú vhodné na použitie na mobilných zariadeniach, systémoch internetu vecí (IoT) a doskách podobných Raspberry Pi, zatiaľ čo ostatné varianty sú vhodné na použitie na pracovných staniciach a systémoch so spotrebiteľskými grafickými procesormi. Veľkosť kontextu, ktorú model zohľadňuje, je 128 000 tokenov pre modely E2B a E4B a 256 000 tokenov pre modely 31B a 26B A4B.

Modely sú viacjazyčné a multimodálne: ihneď po vybalení je podporovaných 35 jazykov (počas tréningu sa použilo viac ako 140 jazykov) a ako vstup je možné spracovať text a obrázky (modely E2B a E4B navyše podporujú spracovanie zvuku). Model 26B A4B je založený na architektúre Mixture-of-Experts (MoE), v ktorej je model rozdelený do série expertných sietí (generovanie odpovedí môže použiť iba 3.8 miliardy parametrov, ale rýchlosť je výrazne vyššia ako pri klasických veľkých modeloch), zatiaľ čo ostatné varianty používajú klasickú monolitickú architektúru.

Modely podporujú uvažovanie a prispôsobiteľné režimy deliberácie a podporujú systémovú rolu na spracovanie inštrukcií (pravidlá, obmedzenia) oddelene od dát. Modely sa dajú použiť na písanie kódu, rozpoznávanie objektov v obrázkoch, analýzu videa po jednotlivých snímkach, parsovanie dokumentov a PDF súborov, optické rozpoznávanie znakov (OCR) tlačeného a ručne písaného textu, rozpoznávanie reči a preklad medzi jazykmi. Môžu sa tiež použiť ako autonómni agenti interagujúci s rôznymi nástrojmi a API.

Vo väčšine testov modely Gemma 4 výrazne prekonali model Gemma 3 s 27 miliardami parametrov. Gemma 4 podporuje LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM a NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix a Keras.

Spoločnosť Google vydala open source model umelej inteligencie Gemma 4, postavený na technológii Gemini 3.
Spoločnosť Google vydala open source model umelej inteligencie Gemma 4, postavený na technológii Gemini 3.


Zdroj: opennet.ru

Pridať komentár