ํ…์ŠคํŠธ ์˜๋ฏธ์˜ ๋ฒกํ„ฐ ํ‘œํ˜„ ๋ชจ๋ธ์ธ Jina Embedding์˜ ์˜คํ”ˆ ์†Œ์Šค ์ฝ”๋“œ

Jina๋Š” Apache 2.0 ๋ผ์ด์„ ์Šค์— ๋”ฐ๋ผ ๋ฒกํ„ฐ ํ…์ŠคํŠธ ํ‘œํ˜„์„ ์œ„ํ•œ ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ jina-embeddings-v2๋ฅผ ์˜คํ”ˆ ์†Œ์Šค๋กœ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉด ์ตœ๋Œ€ 8192๊ฐœ์˜ ๋ฌธ์ž๋ฅผ ํฌํ•จํ•œ ์ž„์˜์˜ ํ…์ŠคํŠธ๋ฅผ ์›๋ณธ ํ…์ŠคํŠธ์™€ ๋น„๊ตํ•˜๊ณ  ํ•ด๋‹น ์˜๋ฏธ(์˜๋ฏธ)๋ฅผ ์žฌํ˜„ํ•˜๋Š” ๋ฒกํ„ฐ๋ฅผ ํ˜•์„ฑํ•˜๋Š” ์ž‘์€ ์‹ค์ˆ˜ ์‹œํ€€์Šค๋กœ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Jina Embedding์€ OpenAI ํ”„๋กœ์ ํŠธ(text-embedding-ada-002)์˜ ๋…์  ํ…์ŠคํŠธ ๋ฒกํ„ฐํ™” ๋ชจ๋ธ๊ณผ ๋™์ผํ•œ ์„ฑ๋Šฅ์„ ๊ฐ–์ถ˜ ์ตœ์ดˆ์˜ ๊ฐœ๋ฐฉํ˜• ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ๋กœ, ์ตœ๋Œ€ 8192๊ฐœ์˜ ํ† ํฐ์œผ๋กœ ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

์ƒ์„ฑ๋œ ๋‘ ๋ฒกํ„ฐ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์†Œ์Šค ํ…์ŠคํŠธ์˜ ์˜๋ฏธ ๊ด€๊ณ„๋ฅผ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ƒ์„ฑ๋œ ๋ฒกํ„ฐ๋Š” ํ…์ŠคํŠธ์˜ ์œ ์‚ฌ์„ฑ ๋ถ„์„, ์ฃผ์ œ์™€ ๊ด€๋ จ๋œ ์ž๋ฃŒ ๊ฒ€์ƒ‰ ๊ตฌ์„ฑ(์˜๋ฏธ์  ๊ทผ์ ‘์„ฑ์— ๋”ฐ๋ฅธ ๊ฒฐ๊ณผ ์ˆœ์œ„ ์ง€์ •), ์˜๋ฏธ๋ณ„๋กœ ํ…์ŠคํŠธ ๊ทธ๋ฃนํ™”, ๊ถŒ์žฅ ์‚ฌํ•ญ ์ƒ์„ฑ(์œ ์‚ฌํ•œ ํ…์ŠคํŠธ ๋ฌธ์ž์—ด ๋ชฉ๋ก ์ œ๊ณต), ์ด์ƒ ์ง•ํ›„๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ํ‘œ์ ˆ์„ ํƒ์ง€ํ•˜๊ณ , ํ…Œ์ŠคํŠธ๋ฅผ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ ์˜์—ญ์˜ ์˜ˆ๋กœ๋Š” ๋ฒ•๋ฅ  ๋ฌธ์„œ ๋ถ„์„, ๋น„์ฆˆ๋‹ˆ์Šค ๋ถ„์„, ๊ณผํ•™ ๊ธฐ์‚ฌ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ์˜ํ•™ ์—ฐ๊ตฌ, ๋ฌธํ•™ ๋น„ํ‰, ์žฌ๋ฌด ๋ณด๊ณ ์„œ ๊ตฌ๋ฌธ ๋ถ„์„ ๋ฐ ๋ณต์žกํ•œ ๋ฌธ์ œ์˜ ์ฑ—๋ด‡ ์ฒ˜๋ฆฌ ํ’ˆ์งˆ ๊ฐœ์„ ์„ ์œ„ํ•œ ๋ชจ๋ธ ์‚ฌ์šฉ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.

jina-embeddings ๋ชจ๋ธ์˜ ๋‘ ๊ฐ€์ง€ ๋ฒ„์ „์„ ๋‹ค์šด๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(๊ธฐ๋ณธ - 0.27GB ๋ฐ ์ถ•์†Œ - 0.07GB). ์ด๋Š” ๋‹ค์–‘ํ•œ ์ง€์‹ ๋ถ„์•ผ๋ฅผ ํฌ๊ด„ํ•˜๋Š” ์˜์–ด๋กœ ๋œ 400์–ต ์Œ์˜ ํ…์ŠคํŠธ ์‹œํ€€์Šค์— ๋Œ€ํ•ด ํ›ˆ๋ จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ ์ค‘์—๋Š” 512๊ฐœ ํ† ํฐ ํฌ๊ธฐ์˜ ์‹œํ€€์Šค๊ฐ€ โ€‹โ€‹์‚ฌ์šฉ๋˜์—ˆ์œผ๋ฉฐ ALiBi(Attention with Linear Biases) ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ 8192๊ฐœ ํฌ๊ธฐ๋กœ ์ถ”์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ๋ณธ ๋ชจ๋ธ์—๋Š” 137์–ต 33๋งŒ ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฉฐ GPU๊ฐ€ ์žˆ๋Š” ๊ณ ์ • ์‹œ์Šคํ…œ์—์„œ ์‚ฌ์šฉํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ถ•์†Œ๋œ ๋ชจ๋ธ์€ 435๋งŒ ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ํฌํ•จํ•˜๊ณ  ์ •ํ™•๋„๊ฐ€ ๋‚ฎ์œผ๋ฉฐ ๋ฉ”๋ชจ๋ฆฌ ์–‘์ด ์ ์€ ๋ชจ๋ฐ”์ผ ์žฅ์น˜ ๋ฐ ์‹œ์Šคํ…œ์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€๊นŒ์šด ๋ฏธ๋ž˜์— ๊ทธ๋“ค์€ ๋˜ํ•œ XNUMX์–ต XNUMX๋งŒ ๊ฐœ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ํฌ๊ด„ํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์„ ๋ฐœํ‘œํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ๋‹ค๊ตญ์–ด ๋ฒ„์ „๋„ ๊ฐœ๋ฐœ ์ค‘์ด๋ฉฐ ํ˜„์žฌ ๋…์ผ์–ด์™€ ์ŠคํŽ˜์ธ์–ด ์ง€์›์— ์ค‘์ ์„ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. LLM ํˆดํ‚ท์„ ํ†ตํ•ด jina-embeddings ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•œ ํ”Œ๋Ÿฌ๊ทธ์ธ์ด ๋ณ„๋„๋กœ ์ค€๋น„๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜ : opennet.ru

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€