Google випустив відкриту AI-модель Gemma 4, побудовану на технологіях Gemini 3

Компанія Google опублікувала нове сімейство великих мовних моделей Gemma 4, заснованих на технологіях моделі Gemini 3. Gemma 4 поширюється під ліцензією Apache у варіантах з 2.3, 4.5, 25.2 та 30.7 мільярдами параметрів (E2B, E4B, 31B та 26B). Варіанти E2B та E4B підходять для використання на мобільних пристроях, системах інтернету речей (IoT) та платах типу Raspberry Pi, а решта варіантів придатні для застосування на робочих станціях та системах зі споживчими GPU. Розмір моделлю контексту, що враховується, становить 128 тисяч токенів для моделей E2B і E4B, і 256 тисяч токенів для моделей 31B і 26B A4B.

Моделі багатомовні та мультимодальні: з коробки підтримується 35 мов (при навчанні використано більше 140 мов), а на вході може оброблятися текст та зображення (моделі E2B та E4B додатково підтримують обробку звуку). Модель 26B A4B заснована на архітектурі MoE (Mixture-of-Experts), при якій модель розділена не серію експертних мереж (при генерації відповіді можуть використовуватися лише 3.8 млрд параметрів, але швидкість істотно вища за класичні великі моделі), а решта варіантів використовують класичну монолітну архітектуру.

Моделі підтримують міркування і режими обдумування, що налаштовуються, підтримують системну роль (System Role) для обробки інструкцій (правил, обмежень) окремо від даних. Моделі можуть використовуватися для написання коду, розпізнавання об'єктів на зображеннях, покадрового аналізу відео, аналізу документів і PDF, оптичного розпізнавання друкованого та рукописного тексту (OCR), розпізнавання мови та перекладу між мовами. Можливе використання як автономних агентів, що взаємодіють з різними інструментами та API.

У більшості тестів моделі серії Gemma 4 суттєво перевершили модель Gemma 3 c 27 мдрд параметрів. Підтримується використання Gemma 4 з інструментами та бібліотеками LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM та NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix та Keras.

Google випустив відкриту AI-модель Gemma 4, побудовану на технологіях Gemini 3
Google випустив відкриту AI-модель Gemma 4, побудовану на технологіях Gemini 3


Джерело: opennet.ru

Додати коментар або відгук