Google์€ Gemini ์ฑ—๋ด‡์— ๊ณตํ†ต๋œ ๊ธฐ์ˆ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ Gemma AI ๋ชจ๋ธ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.

Google์€ ChatGPT์™€ ๊ฒฝ์Ÿํ•˜๋ ค๋Š” Gemini ์ฑ—๋ด‡ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ตฌ์ถ•๋œ ๋Œ€๊ทœ๋ชจ ๊ธฐ๊ณ„ ํ•™์Šต ์–ธ์–ด ๋ชจ๋ธ์ธ Gemma์˜ ์ถœ์‹œ๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ๊ธฐ๋ณธ ๋ฐ ๋Œ€ํ™” ์ƒ์ž ์ตœ์ ํ™” ๋ณด๊ธฐ์—์„œ 2์–ต ๋ฐ 7์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ํฌํ•จํ•˜๋Š” 2๊ฐ€์ง€ ๋ณ€ํ˜•์œผ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. 7์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ์žˆ๋Š” ์˜ต์…˜์€ ์†Œ๋น„์ž ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์‚ฌ์šฉํ•˜๊ธฐ์— ์ ํ•ฉํ•˜๋ฉฐ ์ด๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ์— ์ถฉ๋ถ„ํ•œ CPU๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. XNUMX์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ํฌํ•จ๋œ ์˜ต์…˜์—๋Š” ๋”์šฑ ๊ฐ•๋ ฅํ•œ ํ•˜๋“œ์›จ์–ด์™€ GPU ๋˜๋Š” TPU๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Gemma ๋ชจ๋ธ์˜ ์ ์šฉ ๋ถ„์•ผ์—๋Š” ๋Œ€ํ™” ์‹œ์Šคํ…œ ๋ฐ ๊ฐ€์ƒ ๋น„์„œ ์ƒ์„ฑ, ํ…์ŠคํŠธ ์ƒ์„ฑ, ์ž์—ฐ์–ด๋กœ ๋ฌป๋Š” ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€ ์ƒ์„ฑ, ์ฝ˜ํ…์ธ  ์š”์•ฝ ๋ฐ ์ผ๋ฐ˜ํ™”, ๊ฐœ๋… ๋ฐ ์šฉ์–ด์˜ ๋ณธ์งˆ์— ๋Œ€ํ•œ ์„ค๋ช…, ์˜ค๋ฅ˜ ์ˆ˜์ • ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณธ๋ฌธ์—์„œ ์–ธ์–ด ํ•™์Šต์— ๋Œ€ํ•œ ์ง€์›. ์‹œ, ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด์˜ ์ฝ”๋“œ, ์ฆ‰ ์ž‘ํ’ˆ ๋‹ค์‹œ ์“ฐ๊ธฐ, ํ…œํ”Œ๋ฆฟ์„ ์‚ฌ์šฉํ•œ ๋ฌธ์ž ์ƒ์„ฑ ๋“ฑ ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ๋™์‹œ์— ์ด ๋ชจ๋ธ์€ ํฌ๊ธฐ๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ์ž‘๊ธฐ ๋•Œ๋ฌธ์— ์ผ๋ฐ˜ ๋…ธํŠธ๋ถ์ด๋‚˜ PC์™€ ๊ฐ™์ด ๋ฆฌ์†Œ์Šค๊ฐ€ ์ œํ•œ๋œ ์ž์ฒด ์žฅ๋น„์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ ๋ผ์ด์„ผ์Šค๋Š” ์—ฐ๊ตฌ ๋ฐ ๊ฐœ์ธ ํ”„๋กœ์ ํŠธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ƒ์—…์šฉ ์ œํ’ˆ์—์„œ๋„ ๋ฌด๋ฃŒ ์‚ฌ์šฉ ๋ฐ ๋ฐฐํฌ๋ฅผ ํ—ˆ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ์ˆ˜์ •๋œ ๋ฒ„์ „์„ ์ƒ์„ฑํ•˜๊ณ  ๊ฒŒ์‹œํ•˜๋Š” ๊ฒƒ๋„ ํ—ˆ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋™์‹œ์—, ์ด์šฉ ์•ฝ๊ด€์—์„œ๋Š” ์•…์˜์ ์ธ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์„ ๊ธˆ์ง€ํ•˜๊ณ  ๊ฐ€๋Šฅํ•˜๋ฉด ์ œํ’ˆ์— ์ตœ์‹  ๋ฒ„์ „์˜ Gemma๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Gemma ๋ชจ๋ธ ์ž‘์—…์— ๋Œ€ํ•œ ์ง€์›์€ Transformers ํˆดํ‚ท ๋ฐ Responsible Generative AI Toolkit์— ์ด๋ฏธ ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•˜๋ ค๋ฉด Keras ํ”„๋ ˆ์ž„์›Œํฌ์™€ TensorFlow, JAX ๋ฐ PyTorch์šฉ ๋ฐฑ์—”๋“œ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. MaxText, NVIDIA NeMo ๋ฐ TensorRT-LLM ํ”„๋ ˆ์ž„์›Œํฌ์™€ ํ•จ๊ป˜ Gemma๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

Gemma ๋ชจ๋ธ์ด ๊ณ ๋ คํ•˜๋Š” ์ปจํ…์ŠคํŠธ์˜ ํฌ๊ธฐ๋Š” 8๊ฐœ ํ† ํฐ(ํ…์ŠคํŠธ ์ƒ์„ฑ ์‹œ ๋ชจ๋ธ์ด ์ฒ˜๋ฆฌํ•˜๊ณ  ๊ธฐ์–ตํ•  ์ˆ˜ ์žˆ๋Š” ํ† ํฐ ์ˆ˜)์ž…๋‹ˆ๋‹ค. ๋น„๊ต๋ฅผ ์œ„ํ•ด Gemini ๋ฐ GPT-4 ๋ชจ๋ธ์˜ ์ปจํ…์ŠคํŠธ ํฌ๊ธฐ๋Š” 32๊ฐœ ํ† ํฐ์ด๊ณ , GPT-4 Turbo ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ 128๊ฐœ์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ๋ชจ๋ธ์€ ์˜์–ด๋งŒ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์„ฑ๋Šฅ๋ฉด์—์„œ๋Š” Gemma-7B ๋ชจ๋ธ์ด LLama 2 70B Chat ๋ชจ๋ธ๋ณด๋‹ค ์•ฝ๊ฐ„ ์—ด๋“ฑํ•˜๊ณ  DeciLM-7B, PHI-2(2.7B), Mistral-7B-v0.1 ๋ชจ๋ธ๋ณด๋‹ค๋Š” ์•ฝ๊ฐ„ ์•ž์„œ๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค. Google ๋น„๊ต์—์„œ Gemma-7B ๋ชจ๋ธ์€ LLama 2 7B/13B ๋ฐ Mistral-7B๋ณด๋‹ค ์•ฝ๊ฐ„ ์•ž์„œ ์žˆ์Šต๋‹ˆ๋‹ค.

Google์€ Gemini ์ฑ—๋ด‡์— ๊ณตํ†ต๋œ ๊ธฐ์ˆ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ Gemma AI ๋ชจ๋ธ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.


์ถœ์ฒ˜ : opennet.ru

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€