Google компани Gemini 3 технологид суурилсан нээлттэй эхийн Gemma 4 хиймэл оюун ухааны загварыг гаргалаа.

Google нь Gemini 3 загвар дээр суурилсан Gemma 4 хэмээх том хэмжээний хэлний загваруудын шинэ гэр бүлийг нийтэлжээ. Gemma 4 нь Apache лицензийн дагуу 2.3, 4.5, 25.2, 30.7 тэрбум параметртэй (E2B, E4B, 31B, 26B A4B) хувилбаруудаар түгээгддэг. E2B болон E4B хувилбарууд нь гар утасны төхөөрөмж, Internet of Things (IoT) систем, Raspberry Pi төст самбар дээр ашиглахад тохиромжтой бол бусад хувилбарууд нь ажлын станц болон хэрэглэгчийн GPU бүхий систем дээр ашиглахад тохиромжтой. Загварын авч үзэж буй контекст хэмжээ нь E2B болон E4B загваруудад 128 токен, 31B болон 26B A4B загваруудад 256 токен байна.

Загварууд нь олон хэлтэй болон олон горимтой: 35 хэлийг шууд дэмждэг (сургалтанд 140 гаруй хэлийг ашигласан) бөгөөд текст болон зургийг оролт болгон боловсруулж болно (E2B болон E4B загварууд нь аудио боловсруулалтыг нэмэлтээр дэмждэг). 26B A4B загвар нь Mixture-of-Experts (MoE) архитектур дээр суурилсан бөгөөд загвар нь хэд хэдэн мэргэжлийн сүлжээнд хуваагддаг (хариу үйлдэл үүсгэх нь зөвхөн 3.8 тэрбум параметрийг ашиглах боломжтой боловч хурд нь сонгодог том загваруудаас хамаагүй өндөр), харин бусад хувилбарууд нь сонгодог цул архитектурыг ашигладаг.

Загварууд нь үндэслэл болон өөрчлөх боломжтой хэлэлцүүлгийн горимуудыг дэмждэг бөгөөд өгөгдлөөс тусад нь зааварчилгаа (дүрэм, хязгаарлалт) боловсруулах Системийн үүргийг дэмждэг. Загваруудыг код бичих, зураг дээрх объектуудыг таних, кадр бүрээр нь видео шинжилгээ хийх, баримт бичиг болон PDF файлуудыг задлан шинжлэх, хэвлэмэл болон гар бичмэл текстийн оптик тэмдэгт таних (OCR), яриа таних, хэл хоорондын орчуулга хийхэд ашиглаж болно. Тэдгээрийг мөн янз бүрийн хэрэгсэл болон API-уудтай харилцан үйлчлэх бие даасан агент болгон ашиглаж болно.

Ихэнх туршилтаар Gemma 4 загварууд нь 27 тэрбум параметртэй Gemma 3 загвараас мэдэгдэхүйц илүү гүйцэтгэлтэй байсан. Gemma 4 нь LiteRT-LM, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM болон NeMo, LM Studio, Unsloth, SGLang, Cactus, Basetan, MaxText, Tunix болон Keras-г дэмждэг.

Google компани Gemini 3 технологид суурилсан нээлттэй эхийн Gemma 4 хиймэл оюун ухааны загварыг гаргалаа.
Google компани Gemini 3 технологид суурилсан нээлттэй эхийн Gemma 4 хиймэл оюун ухааны загварыг гаргалаа.


Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх