ګوګل د لوی پیمانه ژبې ماډلونو یوه نوې کورنۍ، ګیما ۴، د جیمیني ۳ ماډل پر بنسټ خپره کړې ده. ګیما ۴ د اپاچي جواز لاندې د ۲.۳، ۴.۵، ۲۵.۲، او ۳۰.۷ ملیارد پیرامیټرو (E2B، E4B، ۳۱B، او ۲۶B A4B) سره په ډولونو کې ویشل شوی دی. د E2B او E4B ډولونه د ګرځنده وسیلو، د شیانو انټرنیټ (IoT) سیسټمونو، او د راسبیري پای په څیر بورډونو کې د کارولو لپاره مناسب دي، پداسې حال کې چې نور ډولونه د کار سټیشنونو او د مصرف کونکي GPUs سره سیسټمونو کې د کارولو لپاره مناسب دي. د ماډل لخوا په پام کې نیول شوی د شرایطو اندازه د E2B او E4B ماډلونو لپاره ۱۲۸،۰۰۰ ټوکنونه دي، او د ۳۱B او ۲۶B A4B ماډلونو لپاره ۲۵۶،۰۰۰ ټوکنونه دي.
ماډلونه څو ژبني او څو ماډلونه دي: د بکس څخه بهر 35 ژبې ملاتړ کیږي (د روزنې پرمهال له 140 څخه ډیرې ژبې کارول شوې وې)، او متن او انځورونه د ان پټ په توګه پروسس کیدی شي (د E2B او E4B ماډلونه د آډیو پروسس کولو ملاتړ هم کوي). د 26B A4B ماډل د متخصصینو د مخلوط (MoE) معمارۍ پراساس دی، په کوم کې چې ماډل د متخصصینو شبکو لړۍ کې ویشل شوی (د ځواب تولید یوازې 3.8 ملیارد پیرامیټرې کارولی شي، مګر سرعت یې د کلاسیک لوی ماډلونو په پرتله د پام وړ لوړ دی)، پداسې حال کې چې نور ډولونه د کلاسیک مونولیتیک معمارۍ کاروي.
ماډلونه د استدلال او دودیز غور کولو طریقو ملاتړ کوي، او د معلوماتو څخه جلا د لارښوونو (قوانینو، محدودیتونو) پروسس کولو لپاره د سیسټم رول ملاتړ کوي. ماډلونه د کوډ لیکلو، په انځورونو کې د شیانو پیژندلو، د چوکاټ په چوکاټ کې د ویډیو تحلیل، د اسنادو او PDFs تحلیل، د چاپ شوي او لاس لیکل شوي متن نظري کرکټر پیژندنه (OCR)، د وینا پیژندنه، او د ژبو ترمنځ ژباړې لپاره کارول کیدی شي. دوی د خپلواکو اجنټانو په توګه هم کارول کیدی شي چې د مختلفو وسیلو او APIs سره تعامل کوي.
په ډیری ازموینو کې، د ګیما ۴ ماډلونو د ۲۷ ملیارد پیرامیټر ګیما ۳ ماډل څخه د پام وړ ښه کار وکړ. ګیما ۴ د LiterRT-LM، vLLM، llama.cpp، MLX، Ollama، NVIDIA NIM او NeMo، LM سټوډیو، Unsloth، SGLang، Cactus، Basetan، MaxText، Tunix، او Keras ملاتړ کوي.


سرچینه: opennet.ru
