FlexGen์€ ๋‹จ์ผ GPU ์‹œ์Šคํ…œ์—์„œ ChatGPT์™€ ์œ ์‚ฌํ•œ AI ๋ด‡์„ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ์—”์ง„์ž…๋‹ˆ๋‹ค.

Stanford University, University of California at Berkeley, ETH Zurich, Carnegie Mellon University ๊ฒฝ์ œ ๋Œ€ํ•™์›, Yandex ๋ฐ Meta์˜ ์—ฐ๊ตฌ์› ํŒ€์ด ๋ฆฌ์†Œ์Šค์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ์—”์ง„์˜ ์†Œ์Šค ์ฝ”๋“œ๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. -์ œ์•ฝ๋œ ์‹œ์Šคํ…œ. ์˜ˆ๋ฅผ ๋“ค์–ด, ์—”์ง„์€ 175GB ๋น„๋””์˜ค ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์žฅ์ฐฉ๋œ NVIDIA RTX175 ๊ฒŒ์ด๋ฐ ๊ทธ๋ž˜ํ”ฝ ์นด๋“œ๊ฐ€ ์žฅ์ฐฉ๋œ ์ผ๋ฐ˜ ์ปดํ“จํ„ฐ์—์„œ 3090์–ต ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๋‹ค๋ฃจ๋Š” ์‚ฌ์ „ ํ›ˆ๋ จ๋œ OPT-24B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜์—ฌ ChatGPT ๋ฐ Copilot์„ ์—ฐ์ƒ์‹œํ‚ค๋Š” ๊ธฐ๋Šฅ์„ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ๋Š” Python์œผ๋กœ ์ž‘์„ฑ๋˜์—ˆ์œผ๋ฉฐ PyTorch ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  Apache 2.0 ๋ผ์ด์„ ์Šค์— ๋”ฐ๋ผ ๋ฐฐํฌ๋ฉ๋‹ˆ๋‹ค.

์—ฌ๊ธฐ์—๋Š” ๊ณต๊ฐœ์ ์œผ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์–ธ์–ด ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์ฆ‰์‹œ ํ†ต์‹ ์„ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋ด‡ ์ƒ์„ฑ์„ ์œ„ํ•œ ์˜ˆ์ œ ์Šคํฌ๋ฆฝํŠธ๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค(์˜ˆ: "python apps/chatbot.py โ€”model facebook/opt-30b โ€” -percent 0 ๋ช…๋ น ์‹คํ–‰). 100 100 0 100 0โ€). ๊ธฐ๋ณธ์ ์œผ๋กœ BookCorpus(10๊ถŒ์˜ ์ฑ…), CC-Stories, Pile(OpenSubtitles, Wikipedia, DM Mathematics, HackerNews ๋“ฑ), Pushshift ์ปฌ๋ ‰์…˜์— ๋Œ€ํ•ด ํ›ˆ๋ จ๋œ Facebook์—์„œ ๊ฒŒ์‹œํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ œ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. io(Reddit ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜) ๋ฐ CCNewsV2(๋‰ด์Šค ์•„์นด์ด๋ธŒ). ์ด ๋ชจ๋ธ์€ ์•ฝ 180์–ต ๊ฐœ์˜ ํ† ํฐ(800GB ๋ฐ์ดํ„ฐ)์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค. 33๊ฐœ์˜ NVIDIA A992 100GB GPU๋ฅผ ์‚ฌ์šฉํ•œ 80์ผ๊ฐ„์˜ ํด๋Ÿฌ์Šคํ„ฐ ์ž‘์—…์ด ๋ชจ๋ธ ๊ต์œก์— ์†Œ์š”๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋‹จ์ผ NVIDIA T175 GPU(4GB)๊ฐ€ ์žฅ์ฐฉ๋œ ์‹œ์Šคํ…œ์—์„œ OPT-16B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๋•Œ FlexGen ์—”์ง„์€ ์ด์ „์— ์ œ๊ณต๋œ ์†”๋ฃจ์…˜๋ณด๋‹ค ์ตœ๋Œ€ 100๋ฐฐ ๋น ๋ฅธ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ์–ด ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ๋ณด๋‹ค ์ €๋ ดํ•˜๊ฒŒ ์‚ฌ์šฉํ•˜๊ณ  ์—ฌ๋Ÿฌ ํ™˜๊ฒฝ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „์šฉ ๊ฐ€์†๊ธฐ๊ฐ€ ์—†๋Š” ์‹œ์Šคํ…œ. ๋™์‹œ์— FlexGen์€ ์—ฌ๋Ÿฌ GPU๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ณ„์‚ฐ์„ ๋ณ‘๋ ฌํ™”ํ•˜๋„๋ก ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด ๋…์ž์ ์ธ ๋งค๊ฐœ๋ณ€์ˆ˜ ์••์ถ• ๋ฐฉ์‹๊ณผ ๋ชจ๋ธ ์บ์‹ฑ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ์ถ”๊ฐ€๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

ํ˜„์žฌ FlexGen์€ OPT ์–ธ์–ด ๋ชจ๋ธ๋งŒ ์ง€์›ํ•˜์ง€๋งŒ ์•ž์œผ๋กœ ๊ฐœ๋ฐœ์ž๋Š” BLOOM(176์–ต ๋งค๊ฐœ๋ณ€์ˆ˜, 46๊ฐœ ์–ธ์–ด ๋ฐ 13๊ฐœ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด ์ง€์›), CodeGen(22๊ฐœ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ์ฝ”๋“œ ์ƒ์„ฑ ๊ฐ€๋Šฅ) ๋ฐ GLM ๋ชจ๋ธ. FlexGen ๋ฐ OPT-30B ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋ด‡๊ณผ์˜ ๋Œ€ํ™” ์˜ˆ:

์ธ๊ฐ„: ์„ธ์ƒ์—์„œ ๊ฐ€์žฅ ๋†’์€ ์‚ฐ์˜ ์ด๋ฆ„์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

์–ด์‹œ์Šคํ„ดํŠธ: ์—๋ฒ ๋ ˆ์ŠคํŠธ.

์ธ๊ฐ„: ๊ธฐ๋…์ผ์— ์—ฌํ–‰์„ ๊ณ„ํšํ•˜๊ณ  ์žˆ์–ด์š”. ์šฐ๋ฆฌ๋Š” ์–ด๋–ค ์ผ์„ ํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

๋ณด์กฐ์ž: ์Œ, ๊ธฐ๋…์ผ์— ํ•  ์ˆ˜ ์žˆ๋Š” ์ผ์ด ๋งŽ์ด ์žˆ์–ด์š”. ์ฒซ์งธ, ์นด๋“œ๋†€์ด๋ฅผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘˜์งธ, ํ•˜์ดํ‚น์„ ๊ฐˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์…‹์งธ, ๋ฐ•๋ฌผ๊ด€์— ๊ฐˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜ : opennet.ru

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€