Google, Gemini chatbotunda ümumi olan texnologiyalara əsaslanan Gemma AI modelini kəşf etdi

Google, ChatGPT ilə rəqabət aparmağa çalışan Gemini chatbot modelini yaratmaq üçün istifadə edilən texnologiyalardan istifadə etməklə qurulmuş böyük maşın öyrənmə dili modeli Gemma-nın nəşrini elan etdi. Model 2 və 7 milyard parametrləri əhatə edən dörd variantda, əsas və dialoq üçün optimallaşdırılmış görünüşlərdə mövcuddur. 2 milyard parametrli seçimlər istehlakçı proqramlarında istifadə üçün uyğundur və onları emal etmək üçün kifayət qədər CPU-ya malikdir. 7 milyard parametrli seçimlər daha güclü aparat və GPU və ya TPU tələb edir.

Gemma modelinin tətbiqi sahələri arasında dialoq sistemlərinin və virtual köməkçilərin yaradılması, mətnin yaradılması, təbii dildə verilən suallara cavabların yaradılması, məzmunun xülasəsi və ümumiləşdirilməsi, anlayış və terminlərin mahiyyətinin izahı, səhvlərin düzəldilməsi daxildir. mətndə, dillərin öyrənilməsində yardım. O, müxtəlif növ mətn məlumatlarının yaradılmasını, o cümlədən şeir, proqramlaşdırma dillərində kod, əsərlərin başqa sözlə yenidən yazılmasını və şablondan istifadə edərək hərflərin yaradılmasını dəstəkləyir. Eyni zamanda, model nisbətən kiçik ölçülərə malikdir, bu, məhdud resursları olan öz avadanlıqlarınızda, məsələn, adi noutbuklarda və fərdi kompüterlərdə istifadə etməyə imkan verir.

Model lisenziyası yalnız tədqiqat və şəxsi layihələrdə deyil, həm də kommersiya məhsullarında pulsuz istifadə və paylanmağa imkan verir. Modelin dəyişdirilmiş versiyalarının yaradılmasına və nəşrinə də icazə verilir. Eyni zamanda, istifadə şərtləri zərərli hərəkətlər etmək üçün modeldən istifadəni qadağan edir və mümkün olduqda, məhsullarınızda Gemma-nın ən son versiyasından istifadə etməyi tələb edir.

Gemma modelləri ilə işləmək üçün dəstək artıq Transformers alətlər dəstinə və Responsible Generative AI Toolbara əlavə edilib. Modeli optimallaşdırmaq üçün TensorFlow, JAX və PyTorch üçün Keras çərçivəsi və arxa uçlarından istifadə edə bilərsiniz. Gemma-dan MaxText, NVIDIA NeMo və TensorRT-LLM çərçivələri ilə də istifadə etmək mümkündür.

Gemma modeli tərəfindən nəzərə alınan kontekstin ölçüsü 8 min tokendir (modelin mətn yaradan zaman emal edə və yadda saxlaya biləcəyi tokenlərin sayı). Müqayisə üçün qeyd edək ki, Gemini və GPT-4 modelləri üçün kontekst ölçüsü 32 min token, GPT-4 Turbo modeli üçün isə 128 mindir. Model yalnız ingilis dilini dəstəkləyir. Performans baxımından Gemma-7B modeli LLama 2 70B Chat modelindən bir qədər aşağıdır və DeciLM-7B, PHI-2 (2.7B) və Mistral-7B-v0.1 modellərini bir qədər qabaqlayır. Google müqayisəsində Gemma-7B modeli LLama 2 7B/13B və Mistral-7B-ni bir qədər qabaqlayır.

Google, Gemini chatbotunda ümumi olan texnologiyalara əsaslanan Gemma AI modelini kəşf etdi


Mənbə: opennet.ru

Добавить комментарий