Google je objavio model umjetne inteligencije otvorenog koda Gemma 4, izgrađen na Gemini 3 tehnologiji.

Google je objavio novu porodicu jezičkih modela velikih razmjera, Gemma 4, zasnovanu na modelu Gemini 3. Gemma 4 se distribuira pod Apache licencom u varijantama sa 2.3, 4.5, 25.2 i 30.7 milijardi parametara (E2B, E4B, 31B i 26B A4B). Varijante E2B i E4B su pogodne za upotrebu na mobilnim uređajima, sistemima Interneta stvari (IoT) i pločama sličnim Raspberry Pi-ju, dok su ostale varijante pogodne za upotrebu na radnim stanicama i sistemima sa potrošačkim GPU-ovima. Veličina konteksta koju model uzima u obzir je 128 tokena za modele E2B i E4B, te 256 tokena za modele 31B i 26B A4B.

Modeli su višejezični i multimodalni: 35 jezika je podržano odmah (preko 140 jezika je korišteno tokom obuke), a tekst i slike se mogu obrađivati ​​kao ulaz (modeli E2B i E4B dodatno podržavaju obradu zvuka). Model 26B A4B zasnovan je na arhitekturi Mixture-of-Experts (MoE), u kojoj je model podijeljen u niz ekspertskih mreža (generiranje odgovora može koristiti samo 3.8 milijardi parametara, ali je brzina znatno veća nego kod klasičnih velikih modela), dok ostale varijante koriste klasičnu monolitnu arhitekturu.

Modeli podržavaju načine zaključivanja i prilagodljive načine razmatranja, te podržavaju sistemsku ulogu za obradu instrukcija (pravila, ograničenja) odvojeno od podataka. Modeli se mogu koristiti za pisanje koda, prepoznavanje objekata na slikama, analizu videa kadar po kadar, parsiranje dokumenata i PDF-ova, optičko prepoznavanje znakova (OCR) štampanog i rukom pisanog teksta, prepoznavanje govora i prevođenje između jezika. Također se mogu koristiti kao autonomni agenti koji komuniciraju s različitim alatima i API-jima.

U većini testova, modeli Gemma 4 su značajno nadmašili model Gemma 3 sa 27 milijardi parametara. Gemma 4 podržava LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM i NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix i Keras.

Google je objavio model umjetne inteligencije otvorenog koda Gemma 4, izgrađen na Gemini 3 tehnologiji.
Google je objavio model umjetne inteligencije otvorenog koda Gemma 4, izgrađen na Gemini 3 tehnologiji.


izvor: opennet.ru

Dodajte komentar