Google, ChatGPT ile rekabet etmeye çalışan Gemini chatbot modelini oluşturmak için kullanılan teknolojiler kullanılarak oluşturulan büyük bir makine öğrenimi dili modeli olan Gemma'nın yayınlandığını duyurdu. Model, temel ve iletişim kutusu için optimize edilmiş görünümlerde 2 ve 7 milyar parametreyi kapsayan dört varyantta mevcuttur. 2 milyar parametreli seçenekler tüketici uygulamalarında kullanıma uygundur ve bunları işleyecek yeterli CPU'ya sahiptir. 7 milyar parametreli seçenekler daha güçlü donanım ve GPU veya TPU gerektirir.
Gemma modelinin uygulama alanları arasında diyalog sistemleri ve sanal asistanların oluşturulması, metin üretimi, doğal dilde sorulan soruların cevaplarının üretilmesi, içeriğin özetlenmesi ve genelleştirilmesi, kavram ve terimlerin özünün açıklanması, hataların düzeltilmesi yer almaktadır. metinde dil öğrenmede yardım. Programlama dillerinde şiir, kod, diğer bir deyişle eserlerin yeniden yazılması, şablon kullanılarak harf üretilmesi gibi çeşitli türde metin verilerinin oluşturulmasını destekler. Aynı zamanda model nispeten küçük bir boyuta sahip olup, örneğin sıradan dizüstü bilgisayarlar ve PC'ler gibi sınırlı kaynaklara sahip kendi ekipmanınızda kullanılmasına olanak tanır.
Model lisansı, yalnızca araştırma ve kişisel projelerde değil, ticari ürünlerde de ücretsiz kullanım ve dağıtıma olanak tanıyor. Modelin değiştirilmiş versiyonlarının oluşturulmasına ve yayınlanmasına da izin verilmektedir. Aynı zamanda kullanım koşulları, modelin kötü amaçlı eylemler gerçekleştirmek için kullanılmasını yasaklar ve mümkün olduğunda ürünlerinizde Gemma'nın en son sürümünün kullanılmasını gerektirir.
Gemma modelleriyle çalışma desteği, Transformers araç kitine ve Sorumlu Üretken Yapay Zeka Araç Seti'ne zaten eklenmiştir. Modeli optimize etmek için TensorFlow, JAX ve PyTorch'a yönelik Keras çerçevesini ve arka uçlarını kullanabilirsiniz. Gemma'yı MaxText, NVIDIA NeMo ve TensorRT-LLM çerçeveleriyle kullanmak da mümkündür.
Gemma modelinin dikkate aldığı bağlamın boyutu 8 bin jetondur (modelin metin oluştururken işleyebileceği ve hatırlayabileceği jeton sayısı). Karşılaştırma yapmak gerekirse, Gemini ve GPT-4 modelleri için bağlam boyutu 32 bin token, GPT-4 Turbo modeli için ise 128 bin tokendir. Model yalnızca İngilizce'yi desteklemektedir. Performans açısından Gemma-7B modeli, LLama 2 70B Chat modelinden biraz daha düşük ve DeciLM-7B, PHI-2 (2.7B) ve Mistral-7B-v0.1 modellerinin biraz ilerisindedir. Google karşılaştırmasında Gemma-7B modeli, LLama 2 7B/13B ve Mistral-7B'nin biraz ilerisinde bulunuyor.

Kaynak: opennet.ru
