Google-ը հրապարակել է Gemini 3 մոդելի վրա հիմնված լայնածավալ լեզվական մոդելների նոր ընտանիք՝ Gemma 4-ը: Gemma 4-ը տարածվում է Apache լիցենզիայի ներքո՝ 2.3, 4.5, 25.2 և 30.7 միլիարդ պարամետրերով տարբերակներով (E2B, E4B, 31B և 26B A4B): E2B և E4B տարբերակները հարմար են բջջային սարքերի, իրերի ինտերնետի (IoT) համակարգերի և Raspberry Pi-անման տախտակների վրա օգտագործելու համար, մինչդեռ մյուս տարբերակները հարմար են աշխատանքային կայանների և սպառողական գրաֆիկական պրոցեսորներով համակարգերի վրա օգտագործելու համար: Մոդելի կողմից հաշվի առնված համատեքստի չափը 128 տոկեն է E2B և E4B մոդելների համար և 256 տոկեն՝ 31B և 26B A4B մոդելների համար:
Մոդելները բազմալեզու և բազմամոդալ են. 35 լեզու աջակցվում է անմիջապես (ուսուցման ընթացքում օգտագործվել է ավելի քան 140 լեզու), իսկ տեքստը և պատկերները կարող են մշակվել որպես մուտքային տվյալներ (E2B և E4B մոդելները լրացուցիչ աջակցում են ձայնային մշակմանը): 26B A4B մոդելը հիմնված է փորձագետների խառնուրդի (MoE) ճարտարապետության վրա, որտեղ մոդելը բաժանված է փորձագիտական ցանցերի շարքի (արձագանքի ստեղծումը կարող է օգտագործել միայն 3.8 միլիարդ պարամետր, բայց արագությունը զգալիորեն ավելի բարձր է, քան դասական մեծ մոդելներինը), մինչդեռ մյուս տարբերակները օգտագործում են դասական մոնոլիտ ճարտարապետություն:
Մոդելները աջակցում են դատողության և անհատականացվող խորհրդակցության ռեժիմներին, ինչպես նաև աջակցում են համակարգային դերին՝ տվյալներից առանձին հրահանգներ (կանոններ, սահմանափակումներ) մշակելու համար: Մոդելները կարող են օգտագործվել կոդ գրելու, պատկերներում օբյեկտները ճանաչելու, կադր առ կադր տեսանյութերի վերլուծության, փաստաթղթերի և PDF ֆայլերի վերլուծության, տպագիր և ձեռագիր տեքստի օպտիկական նիշերի ճանաչման (OCR), խոսքի ճանաչման և լեզուների միջև թարգմանության համար: Դրանք կարող են նաև օգտագործվել որպես ինքնավար գործակալներ՝ տարբեր գործիքների և API-ների հետ փոխազդելով:
Թեստերի մեծ մասում Gemma 4 մոդելները զգալիորեն գերազանցեցին 27 միլիարդ պարամետր ունեցող Gemma 3 մոդելին: Gemma 4-ը աջակցում է LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM և NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix և Keras ձևաչափերին:


Source: opennet.ru
