Google Gemma 2 2B adalah model bahasa kecerdasan buatan (LLM) yang ringkas namun kuat yang dapat bersaing dengan para pemimpin industri meskipun ukurannya jauh lebih kecil. Dengan hanya 2,6 miliar parameter, model bahasa baru ini memberikan kinerja setara dengan rekan-rekan yang jauh lebih besar termasuk OpenAI GPT-3.5 dan Mistral AI Mixtral 8x7B.

Dalam tes LMSYS Chatbot Arena, platform online populer untuk melakukan benchmarking dan menilai kualitas model kecerdasan buatan, Gemma 2 2B mencetak 1130 poin. Hasil ini sedikit mengungguli hasil GPT-3.5-Turbo-0613 (1117 poin) dan Mixtral-8x7B (1114 poin) - model dengan parameter sepuluh kali lebih banyak.

Google mengatakan Gemma 2 2B juga mendapat skor 56,1 pada tes MMLU (Massive Multitask Language Understanding) dan 36,6 pada tes MBPP (Mostly Basic Python Programming), yang merupakan peningkatan signifikan dibandingkan versi sebelumnya.
Gemma 2 2B menantang kebijaksanaan konvensional bahwa model bahasa yang lebih besar secara inheren memiliki kinerja yang lebih baik dibandingkan model bahasa yang lebih kecil. Performa Gemma 2 2B menunjukkan bahwa metode pelatihan yang canggih, efisiensi arsitektur, dan kumpulan data berkualitas tinggi dapat mengimbangi kekurangan parameter. Pengembangan Gemma 2 2B juga menyoroti semakin pentingnya teknik kompresi dan distilasi model AI. Kemampuan untuk mengumpulkan informasi secara efisien dari model yang lebih besar ke model yang lebih kecil membuka pintu bagi alat AI yang lebih terjangkau tanpa mengorbankan kinerja.
Google melatih Gemma 2 2B pada kumpulan data besar sebanyak 2 triliun token menggunakan sistem yang didukung oleh akselerator TPU v5e AI miliknya. Dukungan untuk berbagai bahasa memperluas potensinya untuk digunakan dalam aplikasi global. Model Gemma 2 2B adalah sumber terbuka. Peneliti dan pengembang dapat mengakses model tersebut melalui platform . Ini juga mendukung berbagai kerangka kerja termasuk и .
Sumber:
Sumber: 3dnews.ru
