ጎግል በጌሚኒ 3 ሞዴል ላይ በመመስረት አዲስ የትልቅ ደረጃ የቋንቋ ሞዴሎችን Gemma 4 ቤተሰብ አሳትሟል። Gemma 4 በአፓቼ ፈቃድ ስር በ2.3፣ 4.5፣ 25.2 እና 30.7 ቢሊዮን መለኪያዎች (E2B፣ E4B፣ 31B እና 26B A4B) ተለዋጮች ተከፋፍሏል። የE2B እና E4B ተለዋጮች በሞባይል መሳሪያዎች፣ በኢንተርኔት ኦፍ ቲንግስ (IoT) ስርዓቶች እና በRaspberry Pi-like ቦርዶች ላይ ለመጠቀም ተስማሚ ሲሆኑ ሌሎቹ ተለዋጮች ደግሞ በተጠቃሚ ጂፒዩዎች ባሉ የስራ ጣቢያዎች እና ስርዓቶች ላይ ለመጠቀም ተስማሚ ናቸው። በሞዴሉ የሚታሰበው የአውድ መጠን ለE2B እና E4B ሞዴሎች 128 ቶከኖች እና ለ31B እና 26B A4B ሞዴሎች 256 ቶከኖች ነው።
ሞዴሎቹ ባለብዙ ቋንቋ እና ባለብዙ ሞዳል ናቸው፡ 35 ቋንቋዎች ከሳጥኑ ውጭ ይደገፋሉ (በስልጠና ወቅት ከ140 በላይ ቋንቋዎች ጥቅም ላይ ውለዋል)፣ እና ጽሑፍ እና ምስሎች እንደ ግብዓት ሊሰሩ ይችላሉ (የE2B እና E4B ሞዴሎች የድምጽ ማቀነባበሪያን በተጨማሪ ይደግፋሉ)። የ26B A4B ሞዴል የተመሰረተው በባለሙያዎች ድብልቅ (MoE) አርክቴክቸር ላይ ሲሆን ሞዴሉ በተከታታይ የባለሙያ አውታረ መረቦች የተከፈለ ነው (የምላሽ ማመንጨት 3.8 ቢሊዮን መለኪያዎችን ብቻ ሊጠቀም ይችላል፣ ነገር ግን ፍጥነቱ ከጥንታዊ ትላልቅ ሞዴሎች በእጅጉ የላቀ ነው)፣ ሌሎች ልዩነቶች ደግሞ ክላሲክ ሞኖሊቲክ አርክቴክቸር ይጠቀማሉ።
ሞዴሎቹ አመክንዮአዊ እና ሊበጁ የሚችሉ የማሰብ ሁነታዎችን ይደግፋሉ፣ እና መመሪያዎችን (ደንቦችን፣ ገደቦችን) ከውሂብ ለይተው ለማስኬድ የስርዓት ሚናን ይደግፋሉ። ሞዴሎቹ ኮድ ለመጻፍ፣ በምስሎች ውስጥ ያሉ ነገሮችን ለመለየት፣ በፍሬም-በፍሬም ቪዲዮ ትንተና፣ ሰነዶችን እና ፒዲኤፎችን ለመተንተን፣ የታተሙ እና በእጅ የተጻፉ ጽሑፎችን የኦፕቲካል ቁምፊ ለይቶ ማወቅ (OCR)፣ የንግግር ማወቂያ እና በቋንቋዎች መካከል ለመተርጎም ሊያገለግሉ ይችላሉ። እንዲሁም ከተለያዩ መሳሪያዎች እና ኤፒአይዎች ጋር መስተጋብር ለመፍጠር እንደ ራስ-ሰር ወኪሎች ሊያገለግሉ ይችላሉ።
በአብዛኛዎቹ ሙከራዎች፣ የጌማ 4 ሞዴሎች ከ27 ቢሊዮን ፓራሜትር የጌማ 3 ሞዴል በእጅጉ በላቀ ሁኔታ ብልጫ አሳይተዋል። Gemma 4 LiteRT-LM፣ vLLM፣ llama.cpp፣ MLX፣ Ollama፣ NVIDIA NIM እና NeMo፣ LM Studio፣ Unsloth፣ SGLang፣ Cactus፣ Basetan፣ MaxText፣ Tunix እና Kerasን ይደግፋል።


ምንጭ: opennet.ru
