Google์ ChatGPT์ ๊ฒฝ์ํ๋ ค๋ Gemini ์ฑ๋ด ๋ชจ๋ธ์ ๊ตฌ์ถํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ ๊ตฌ์ถ๋ ๋๊ท๋ชจ ๊ธฐ๊ณ ํ์ต ์ธ์ด ๋ชจ๋ธ์ธ Gemma์ ์ถ์๋ฅผ ๋ฐํํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๊ธฐ๋ณธ ๋ฐ ๋ํ ์์ ์ต์ ํ ๋ณด๊ธฐ์์ 2์ต ๋ฐ 7์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ํฌํจํ๋ 2๊ฐ์ง ๋ณํ์ผ๋ก ์ ๊ณต๋ฉ๋๋ค. 7์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๊ฐ ์๋ ์ต์ ์ ์๋น์ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ฌ์ฉํ๊ธฐ์ ์ ํฉํ๋ฉฐ ์ด๋ฅผ ์ฒ๋ฆฌํ๊ธฐ์ ์ถฉ๋ถํ CPU๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. XNUMX์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๊ฐ ํฌํจ๋ ์ต์ ์๋ ๋์ฑ ๊ฐ๋ ฅํ ํ๋์จ์ด์ GPU ๋๋ TPU๊ฐ ํ์ํฉ๋๋ค.
Gemma ๋ชจ๋ธ์ ์ ์ฉ ๋ถ์ผ์๋ ๋ํ ์์คํ ๋ฐ ๊ฐ์ ๋น์ ์์ฑ, ํ ์คํธ ์์ฑ, ์์ฐ์ด๋ก ๋ฌป๋ ์ง๋ฌธ์ ๋ํ ๋ต๋ณ ์์ฑ, ์ฝํ ์ธ ์์ฝ ๋ฐ ์ผ๋ฐํ, ๊ฐ๋ ๋ฐ ์ฉ์ด์ ๋ณธ์ง์ ๋ํ ์ค๋ช , ์ค๋ฅ ์์ ๋ฑ์ด ์์ต๋๋ค. ๋ณธ๋ฌธ์์ ์ธ์ด ํ์ต์ ๋ํ ์ง์. ์, ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ์ฝ๋, ์ฆ ์ํ ๋ค์ ์ฐ๊ธฐ, ํ ํ๋ฆฟ์ ์ฌ์ฉํ ๋ฌธ์ ์์ฑ ๋ฑ ๋ค์ํ ์ ํ์ ํ ์คํธ ๋ฐ์ดํฐ ์์ฑ์ ์ง์ํฉ๋๋ค. ๋์์ ์ด ๋ชจ๋ธ์ ํฌ๊ธฐ๊ฐ ์๋์ ์ผ๋ก ์๊ธฐ ๋๋ฌธ์ ์ผ๋ฐ ๋ ธํธ๋ถ์ด๋ PC์ ๊ฐ์ด ๋ฆฌ์์ค๊ฐ ์ ํ๋ ์์ฒด ์ฅ๋น์์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๋ชจ๋ธ ๋ผ์ด์ผ์ค๋ ์ฐ๊ตฌ ๋ฐ ๊ฐ์ธ ํ๋ก์ ํธ๋ฟ๋ง ์๋๋ผ ์์ ์ฉ ์ ํ์์๋ ๋ฌด๋ฃ ์ฌ์ฉ ๋ฐ ๋ฐฐํฌ๋ฅผ ํ์ฉํฉ๋๋ค. ๋ชจ๋ธ์ ์์ ๋ ๋ฒ์ ์ ์์ฑํ๊ณ ๊ฒ์ํ๋ ๊ฒ๋ ํ์ฉ๋ฉ๋๋ค. ๋์์, ์ด์ฉ ์ฝ๊ด์์๋ ์ ์์ ์ธ ์์ ์ ์ํํ๊ธฐ ์ํด ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ์ ๊ธ์งํ๊ณ ๊ฐ๋ฅํ๋ฉด ์ ํ์ ์ต์ ๋ฒ์ ์ Gemma๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๋ค.
Gemma ๋ชจ๋ธ ์์ ์ ๋ํ ์ง์์ Transformers ํดํท ๋ฐ Responsible Generative AI Toolkit์ ์ด๋ฏธ ์ถ๊ฐ๋์์ต๋๋ค. ๋ชจ๋ธ์ ์ต์ ํํ๋ ค๋ฉด Keras ํ๋ ์์ํฌ์ TensorFlow, JAX ๋ฐ PyTorch์ฉ ๋ฐฑ์๋๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค. MaxText, NVIDIA NeMo ๋ฐ TensorRT-LLM ํ๋ ์์ํฌ์ ํจ๊ป Gemma๋ฅผ ์ฌ์ฉํ ์๋ ์์ต๋๋ค.
Gemma ๋ชจ๋ธ์ด ๊ณ ๋ คํ๋ ์ปจํ ์คํธ์ ํฌ๊ธฐ๋ 8๊ฐ ํ ํฐ(ํ ์คํธ ์์ฑ ์ ๋ชจ๋ธ์ด ์ฒ๋ฆฌํ๊ณ ๊ธฐ์ตํ ์ ์๋ ํ ํฐ ์)์ ๋๋ค. ๋น๊ต๋ฅผ ์ํด Gemini ๋ฐ GPT-4 ๋ชจ๋ธ์ ์ปจํ ์คํธ ํฌ๊ธฐ๋ 32๊ฐ ํ ํฐ์ด๊ณ , GPT-4 Turbo ๋ชจ๋ธ์ ๊ฒฝ์ฐ 128๊ฐ์ ๋๋ค. ํด๋น ๋ชจ๋ธ์ ์์ด๋ง ์ง์ํฉ๋๋ค. ์ฑ๋ฅ๋ฉด์์๋ Gemma-7B ๋ชจ๋ธ์ด LLama 2 70B Chat ๋ชจ๋ธ๋ณด๋ค ์ฝ๊ฐ ์ด๋ฑํ๊ณ DeciLM-7B, PHI-2(2.7B), Mistral-7B-v0.1 ๋ชจ๋ธ๋ณด๋ค๋ ์ฝ๊ฐ ์์๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค. Google ๋น๊ต์์ Gemma-7B ๋ชจ๋ธ์ LLama 2 7B/13B ๋ฐ Mistral-7B๋ณด๋ค ์ฝ๊ฐ ์์ ์์ต๋๋ค.
์ถ์ฒ : opennet.ru