Databricks๋ ์์ฐ์ด ์ง๋ฌธ์ ๋ตํ๊ณ , ์ํ ๋ฌธ์ ๋ฅผ ํ๊ณ , ์ฃผ์ด์ง ์ฃผ์ ์ ๋ํ ์ฝํ ์ธ ๋ฅผ ์์ฑํ๊ณ , ๋ค์ํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ก ์ฝ๋๋ฅผ ์์ฑํ ์ ์๋ ์ฑ๋ด์ ๋ง๋๋ ๋ฐ ์ฌ์ฉํ ์ ์๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ธ DBRX๋ฅผ ๋ฐ๊ฒฌํ๋ค๊ณ ๋ฐํํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ Mosaic ML์์ ๊ฐ๋ฐํ์ผ๋ฉฐ, Databricks๊ฐ 1.3์ต ๋ฌ๋ฌ์ ์ธ์ํ์ต๋๋ค. 3072๊ฐ์ NVIDIA H100 Tensor Core GPU ํด๋ฌ์คํฐ๊ฐ ํ์ต์ ์ฌ์ฉ๋์์ต๋๋ค. ์์ฑ๋ ๋ชจ๋ธ์ ์คํํ๋ ค๋ฉด 320GB ๋ฉ๋ชจ๋ฆฌ๊ฐ ๊ถ์ฅ๋ฉ๋๋ค.
๋ชจ๋ธ์ ํ์ตํ ๋, ๋์ฑ ์ ํํ ์ ๋ฌธ๊ฐ ํ๊ฐ๊ฐ ๊ฐ๋ฅํ MoE(์ ๋ฌธ๊ฐ ํผํฉ) ์ํคํ ์ฒ์ 12TB ํฌ๊ธฐ์ ํ ์คํธ์ ์ฝ๋ ์ปฌ๋ ์ ์ ์ฌ์ฉํ์ต๋๋ค. DBRX ๋ชจ๋ธ์ด ๊ณ ๋ คํ๋ ์ปจํ ์คํธ์ ํฌ๊ธฐ๋ 32๊ฐ ํ ํฐ์ ๋๋ค(๋ชจ๋ธ์ด ํ ์คํธ๋ฅผ ์์ฑํ ๋ ์ฒ๋ฆฌํ๊ณ ๊ธฐ์ตํ ์ ์๋ ํ ํฐ ์). ๋น๊ต๋ฅผ ์ํด, Google Gemini์ OpenAI GPT-4 ๋ชจ๋ธ์ ์ปจํ ์คํธ ํฌ๊ธฐ๋ 32๊ฐ, Google Gemma๋ 8๊ฐ, GPT-4 Turbo ๋ชจ๋ธ์ 128๊ฐ์ ๋๋ค.
์ด ๋ชจ๋ธ์ 132์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ํฌ๊ดํ๋ฉฐ 16๊ฐ์ ์ ๋ฌธ๊ฐ ๋คํธ์ํฌ๋ก ๋๋ฉ๋๋ค. ์์ฒญ์ ์ฒ๋ฆฌํ ๋ ์ต๋ 4๊ฐ๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค(๊ฐ ํ ํฐ์ ๋ํด ์ต๋ 36์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ํฌ๊ด). ๋น๊ต๋ฅผ ์ํด, GPT-4 ๋ชจ๋ธ์ 1.76์กฐ 314์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ํฌํจํ๋ ๊ฒ์ผ๋ก ์ถ์ ๋๋ฉฐ, ์ต๊ทผ ๋ฐ๊ฒฌ๋ X/Twitter Grok ๋ชจ๋ธ(X/Twitter)์ 3.5์ต ๊ฐ, GPT-175๋ 100์ต ๊ฐ, YaLM(Yandex)์ 65์ต ๊ฐ, LLaMA(Meta)๋ 29์ต ๊ฐ, GigaChat(Sber)์ 7์ต ๊ฐ, Gemma(Google)๋ XNUMX์ต ๊ฐ์ ๋๋ค.
์ด ๋ชจ๋ธ๊ณผ ๊ด๋ จ ๊ตฌ์ฑ ์์๋ Databricks Open Model License์ ๋ฐ๋ผ ๋ผ์ด์ ์ค๊ฐ ๋ถ์ฌ๋์ด ์์ผ๋ฉฐ, ์ด์ ๋ฐ๋ผ ์ฌ์ฉ, ๋ณต์ , ๋ณต์ฌ, ์์ ๋ฐ ํ์ ์ํ ์์ฑ์ด ํ์ฉ๋์ง๋ง ๋ช ๊ฐ์ง ์ ํ์ด ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋ผ์ด์ ์ค๋ DBRX, ๊ทธ ํ์ ๋ชจ๋ธ ๋ฐ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ถ๋ ฅ์ ์ฌ์ฉํ์ฌ DBRX ์ด์ธ์ ์ธ์ด ๋ชจ๋ธ์ ํฅ์์ํค๋ ๊ฒ์ ๊ธ์งํฉ๋๋ค. ๋ํ ๋ผ์ด์ ์ค์์๋ ๋ฒ๋ฅ ๊ณผ ๊ท์ ์ ์๋ฐํ๋ ์์ญ์์ ํด๋น ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ์ ๊ธ์งํฉ๋๋ค. ํ์ ๋ชจ๋ธ์ ๋์ผํ ๋ผ์ด์ ์ค์ ๋ฐ๋ผ ๋ฐฐํฌ๋์ด์ผ ํฉ๋๋ค. ์ 700์ต ๋ช ์ด์์ ์ฌ์ฉ์๊ฐ ์ฌ์ฉํ๋ ์ ํ ๋ฐ ์๋น์ค์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ณ๋์ ํ๊ฐ๊ฐ ํ์ํฉ๋๋ค.
๋ชจ๋ธ ๊ฐ๋ฐ์์ ๋ฐ๋ฅด๋ฉด, DBRX๋ ํน์ฑ๊ณผ ๊ธฐ๋ฅ ๋ฉด์์ OpenAI์ GPT-3.5 ๋ชจ๋ธ๊ณผ Twitter์ Grok-1์ ๋ฅ๊ฐํ๋ฉฐ, ์ธ์ด ์ดํด ์์ค, ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ก ์ฝ๋๋ฅผ ์์ฑํ๋ ๋ฅ๋ ฅ, ์ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฅ๋ ฅ ๋ฑ์ ํ ์คํธํ ๋ Gemini 1.0 Pro ๋ชจ๋ธ๊ณผ ๊ฒฝ์ํ ์ ์์ต๋๋ค. SQL ์ฟผ๋ฆฌ ์์ฑ๊ณผ ๊ฐ์ ์ผ๋ถ ์ ํ๋ฆฌ์ผ์ด์ ์์ DBRX๋ ์์ฅ์ ์ ๋ํ๋ GPT-4 Turbo ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ทผ์ ํฉ๋๋ค. ๋ํ ์ด ๋ชจ๋ธ์ ๋งค์ฐ ๋น ๋ฅด๊ฒ ์๋ํ๊ณ ๊ฑฐ์ ์ฆ๊ฐ์ ์ผ๋ก ์๋ต์ ์์ฑํ ์ ์๋ค๋ ์ ์์ ๊ฒฝ์ ์๋น์ค์ ๋ค๋ฆ ๋๋ค. ํนํ DBRX๋ ์ฌ์ฉ์๋น ์ด๋น ์ต๋ 150๊ฐ์ ํ ํฐ ์๋๋ก ํ ์คํธ๋ฅผ ์์ฑํ ์ ์๋๋ฐ, ์ด๋ LLaMA2-70B ๋ชจ๋ธ๋ณด๋ค ์ฝ XNUMX๋ฐฐ ๋น ๋ฆ ๋๋ค.


๋ํ Apache 2 ๋ผ์ด์ ์ค์ ๋ฐ๋ผ ๋ฐฐํฌ๋๊ณ 2.0์ต, 20์ต, 7์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๊ฐ ์๋ ๋ฒ์ ์ผ๋ก ์ ๊ณต๋๋ ๊ฐ๋ฐฉํ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ InternLM1.8์ ๋ํ ๊ธฐ์ ์ค๋ช ์๊ฐ ๊ฒ์๋์๋ค๋ ์ ๋ ์ฃผ๋ชฉํ ๋งํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ๋ช๋ช ์ค๊ตญ ๋ํ์ ์ฐธ์ฌ๋ก ์ํ์ด ์ธ๊ณต์ง๋ฅ ์ฐ๊ตฌ์์์ ๊ฐ๋ฐํ๊ณ ์์ผ๋ฉฐ, ์ต๋ 200๋ง ๊ฐ์ ์ปจํ ์คํธ ํ ํฐ์ ๊ณ ๋ คํ๊ณ ์์ด๋ฟ๋ง ์๋๋ผ ์ค๊ตญ์ด๋ ์ง์ํ๋ค๋ ์ ์ด ์ฃผ๋ชฉํ ๋งํฉ๋๋ค. ๋ง์ ํ ์คํธ์์ ์ด ๋ชจ๋ธ์ GPT-4์ ์ ์ฌํฉ๋๋ค.



๋ํ, Mozilla๊ฐ ๊ฐ๋ฐํ llamafile ํดํท์ ์ํด 84๊ฐ์ ์๋ก์ด ํ๋ ฌ ๊ณฑ์
์ปค๋์ด ๊ฐ๋ฐ๋์์ต๋๋ค. ์ด ํดํท์ ๋๊ท๋ชจ ๋จธ์ ๋ฌ๋ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์คํํ๊ธฐ ์ํ ๋ฒ์ฉ ์คํ ํ์ผ์ ์์ฑํฉ๋๋ค. ์ด๋ฌํ ๋ณ๊ฒฝ์ผ๋ก ์ธํด CPU์์ llamafile์ ๋ชจ๋ธ ์์
์ ์คํํ ๋ ์์
์๋๊ฐ ์๋นํ ๋นจ๋ผ์ก์ต๋๋ค. ์๋ฅผ ๋ค์ด, llamafile์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ์คํํ๋ ๊ฒ์ ์ด์ ํ๊ฒฝ์ ๋ฐ๋ผ llama.cpp๋ฅผ ์ฌ์ฉํ๋ ๊ฒ๋ณด๋ค 30%~500% ๋ ๋น ๋ฅด๋ฉฐ, MKL ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋น๊ตํ์ ๋ L2 ์บ์์ ๋ง๋ ํ๋ ฌ ์ฐ์ฐ์ ์ ๊ตฌํ์์ ๋ ๋ฐฐ ๋ ๋น ๋ฅด๊ฒ ์คํ๋ฉ๋๋ค.
์ถ์ฒ : opennet.ru
