Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

Highload++ ๋ฐ DataFest Minsk 2019์—์„œ์˜ ์—ฐ์„ค์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

์˜ค๋Š˜๋‚  ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์—๊ฒŒ ๋ฉ”์ผ์€ ์˜จ๋ผ์ธ ์ƒํ™œ์˜ ํ•„์ˆ˜์ ์ธ ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค. ๋„์›€์„ ๋ฐ›์•„ ์šฐ๋ฆฌ๋Š” ๋น„์ฆˆ๋‹ˆ์Šค ์„œ์‹ ์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ์žฌ์ •, ํ˜ธํ…” ์˜ˆ์•ฝ, ์ฃผ๋ฌธ ๋“ฑ๊ณผ ๊ด€๋ จ๋œ ๋ชจ๋“  ์ข…๋ฅ˜์˜ ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค. 2018๋…„ ์ค‘๋ฐ˜์—๋Š” ๋ฉ”์ผ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ์ œํ’ˆ ์ „๋žต์„ ์ˆ˜๋ฆฝํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„๋Œ€ ๋ฉ”์ผ์€ ์–ด๋–ค ๋ชจ์Šต์ด์–ด์•ผ ํ• ๊นŒ์š”?

๋ฉ”์ผ์€ ๋ฐ˜๋“œ์‹œ ๋˜‘๋˜‘ํ•œ์ฆ‰, ์‚ฌ์šฉ์ž๊ฐ€ ์ฆ๊ฐ€ํ•˜๋Š” ์ •๋ณด์˜ ์–‘์„ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค๋‹ˆ๋‹ค. ๊ฐ€์žฅ ํŽธ๋ฆฌํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•„ํ„ฐ๋ง, ๊ตฌ์กฐํ™” ๋ฐ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋…€๋Š” ๋ถ„๋ช… ์œ ๋Šฅํ•œ, ์˜ˆ๋ฅผ ๋“ค์–ด ๋ฒŒ๊ธˆ ๋‚ฉ๋ถ€์™€ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์‚ฌ์„œํ•จ์—์„œ ๋ฐ”๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(๋ถˆํ–‰ํžˆ๋„ ์ œ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ๊ธฐ๋Šฅ). ๋™์‹œ์— ๋ฉ”์ผ์€ ์ •๋ณด ๋ณดํ˜ธ, ์ŠคํŒธ ์ฐจ๋‹จ, ํ•ดํ‚น ๋ฐฉ์ง€ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์•ˆ์ „ํ•œ.

์ด๋Ÿฌํ•œ ์˜์—ญ์€ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์ฃผ์š” ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๋ฉฐ, ๊ทธ ์ค‘ ๋‹ค์ˆ˜๋Š” ๊ธฐ๊ณ„ ํ•™์Šต์„ ์‚ฌ์šฉํ•˜์—ฌ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ์ „๋žต์˜ ์ผ๋ถ€๋กœ ๊ฐœ๋ฐœ๋œ ๊ธฐ์กด ๊ธฐ๋Šฅ์˜ ์˜ˆ์ž…๋‹ˆ๋‹ค(๊ฐ ๋ฐฉํ–ฅ๋งˆ๋‹ค ํ•˜๋‚˜์”ฉ).

  • ์Šค๋งˆํŠธ ๋‹ต์žฅ. ๋ฉ”์ผ์—๋Š” ์Šค๋งˆํŠธ ๋‹ต์žฅ ๊ธฐ๋Šฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ ๊ฒฝ๋ง์€ ํŽธ์ง€์˜ ํ…์ŠคํŠธ๋ฅผ ๋ถ„์„ํ•˜๊ณ  ๊ทธ ์˜๋ฏธ์™€ ๋ชฉ์ ์„ ์ดํ•ดํ•˜๋ฉฐ ๊ทธ ๊ฒฐ๊ณผ ๊ธ์ •์ , ๋ถ€์ •์ , ์ค‘๋ฆฝ์ด๋ผ๋Š” ๊ฐ€์žฅ ์ ์ ˆํ•œ ์„ธ ๊ฐ€์ง€ ์‘๋‹ต ์˜ต์…˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ํŽธ์ง€์— ๋‹ตํ•  ๋•Œ ์‹œ๊ฐ„์„ ํฌ๊ฒŒ ์ ˆ์•ฝํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜๋ฉฐ ์ข…์ข… ๋น„ํ‘œ์ค€์ ์ด๊ณ  ์žฌ๋ฏธ์žˆ๋Š” ๋ฐฉ์‹์œผ๋กœ ์‘๋‹ตํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.
  • ์ด๋ฉ”์ผ ๊ทธ๋ฃนํ™”์˜จ๋ผ์ธ ์ƒ์  ์ฃผ๋ฌธ๊ณผ ๊ด€๋ จ๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์˜จ๋ผ์ธ์œผ๋กœ ์‡ผํ•‘ํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉฐ ์ผ๋ฐ˜์ ์œผ๋กœ ๋งค์žฅ์—์„œ๋Š” ๊ฐ ์ฃผ๋ฌธ์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ ์ด๋ฉ”์ผ์„ ๋ณด๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฐ€์žฅ ํฐ ์„œ๋น„์Šค์ธ AliExpress์—์„œ๋Š” ํ•˜๋‚˜์˜ ์ฃผ๋ฌธ์— ๋Œ€ํ•ด ๋งŽ์€ ํŽธ์ง€๊ฐ€ ๋“ค์–ด์˜ค๊ณ  ํ„ฐ๋ฏธ๋„์˜ ๊ฒฝ์šฐ ๊ทธ ์ˆซ์ž๊ฐ€ ์ตœ๋Œ€ 29์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ๊ณ„์‚ฐํ–ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋ช…๋ช…๋œ ์—”ํ„ฐํ‹ฐ ์ธ์‹ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ฃผ๋ฌธ ๋ฒˆํ˜ธ๋ฅผ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ํ…์ŠคํŠธ์˜ ๊ธฐํƒ€ ์ •๋ณด์™€ ๋ชจ๋“  ๋ฌธ์ž๋ฅผ ํ•˜๋‚˜์˜ ์Šค๋ ˆ๋“œ๋กœ ๊ทธ๋ฃนํ™”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์ฃผ๋ฌธ์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ์ •๋ณด๋ฅผ ๋ณ„๋„์˜ ์ƒ์ž์— ํ‘œ์‹œํ•˜๋ฏ€๋กœ ์ด๋Ÿฌํ•œ ์œ ํ˜•์˜ ์ด๋ฉ”์ผ ์ž‘์—…์„ ๋” ์‰ฝ๊ฒŒ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

    Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

  • ์‚ฌ์นญ ๋ฐฉ์ง€. ํ”ผ์‹ฑ์€ ๊ณต๊ฒฉ์ž๊ฐ€ ๊ธˆ์œต ์ •๋ณด(์‚ฌ์šฉ์ž์˜ ์€ํ–‰ ์นด๋“œ ํฌํ•จ) ๋ฐ ๋กœ๊ทธ์ธ ์ •๋ณด๋ฅผ ์–ป์œผ๋ ค๊ณ  ์‹œ๋„ํ•˜๋Š” ํŠนํžˆ ์œ„ํ—˜ํ•œ ์‚ฌ๊ธฐ ์œ ํ˜•์˜ ์ด๋ฉ”์ผ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ž๋Š” ์‹œ๊ฐ์ ์ธ ๊ฒƒ์„ ํฌํ•จํ•˜์—ฌ ํ•ด๋‹น ์„œ๋น„์Šค์—์„œ ๋ณด๋‚ธ ์‹ค์ œ ๋ฌธ์ž๋ฅผ ๋ชจ๋ฐฉํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ Computer Vision์˜ ๋„์›€์œผ๋กœ ์šฐ๋ฆฌ๋Š” ๋Œ€๊ธฐ์—…(์˜ˆ: Mail.ru, Sber, Alfa)์˜ ๋กœ๊ณ ์™€ ํŽธ์ง€์˜ ๋””์ž์ธ ์Šคํƒ€์ผ์„ ์ธ์‹ํ•˜๊ณ  ์ด๋ฅผ ์ŠคํŒธ ๋ฐ ํ”ผ์‹ฑ ๋ถ„๋ฅ˜๊ธฐ์˜ ํ…์ŠคํŠธ ๋ฐ ๊ธฐํƒ€ ๊ธฐ๋Šฅ๊ณผ ํ•จ๊ป˜ ๊ณ ๋ คํ•ฉ๋‹ˆ๋‹ค. .

๊ธฐ๊ณ„ ํ•™์Šต

์ผ๋ฐ˜์ ์ธ ์ด๋ฉ”์ผ์˜ ๊ธฐ๊ณ„ ํ•™์Šต์— ๋Œ€ํ•ด ์กฐ๊ธˆ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ๋ฉ”์ผ์€ ๋ถ€ํ•˜๊ฐ€ ๋†’์€ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ํ•˜๋ฃจ ํ‰๊ท  1,5์–ต ๊ฐœ์˜ ํŽธ์ง€๊ฐ€ 30์ฒœ๋งŒ DAU ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•ด ๋‹น์‚ฌ ์„œ๋ฒ„๋ฅผ ํ†ต๊ณผํ•ฉ๋‹ˆ๋‹ค. ์•ฝ 30๊ฐœ์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์ด ํ•„์š”ํ•œ ๋ชจ๋“  ๊ธฐ๋Šฅ๊ณผ ๊ธฐ๋Šฅ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๊ฐ ๋ฌธ์ž๋Š” ์ „์ฒด ๋ถ„๋ฅ˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ํ†ต๊ณผํ•ฉ๋‹ˆ๋‹ค. ๋จผ์ € ์ŠคํŒธ์„ ์ฐจ๋‹จํ•˜๊ณ  ์ข‹์€ ์ด๋ฉ”์ผ์„ ๋‚จ๊ฒจ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค. ์ŠคํŒธ์˜ 95-99%๊ฐ€ ์ ์ ˆํ•œ ํด๋”์— ๋“ค์–ด๊ฐ€์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์šฉ์ž๋Š” ์ŠคํŒธ ๋ฐฉ์ง€ ์ž‘์—…์„ ์ธ์‹ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ์ŠคํŒธ ์ธ์‹์€ ์šฐ๋ฆฌ ์‹œ์Šคํ…œ์—์„œ ๋งค์šฐ ์ค‘์š”ํ•œ ๋ถ€๋ถ„์ด์ž ๊ฐ€์žฅ ์–ด๋ ค์šด ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค. ์ŠคํŒธ ๋ฐฉ์ง€ ๋ถ„์•ผ์—์„œ๋Š” ๋ฐฉ์–ด ์‹œ์Šคํ…œ๊ณผ ๊ณต๊ฒฉ ์‹œ์Šคํ…œ ์‚ฌ์ด์— ์ง€์†์ ์ธ ์ ์‘์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์šฐ๋ฆฌ ํŒ€์— ์ง€์†์ ์ธ ์—”์ง€๋‹ˆ์–ด๋ง ๊ณผ์ œ๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๋‹ค์Œ์œผ๋กœ ๋ฌธ์ž์™€ ์‚ฌ๋žŒ, ๋กœ๋ด‡์„ ๋ถ„๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๋“ค์ด ๋ณด๋‚ธ ์ด๋ฉ”์ผ์ด ๊ฐ€์žฅ ์ค‘์š”ํ•˜๋ฏ€๋กœ ์šฐ๋ฆฌ๋Š” ๊ทธ๋“ค์„ ์œ„ํ•ด ์Šค๋งˆํŠธ ๋‹ต์žฅ๊ณผ ๊ฐ™์€ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์˜ ํŽธ์ง€๋Š” ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค. ๊ฑฐ๋ž˜ - ์ด๋Š” ๊ตฌ๋งค ํ™•์ธ ๋˜๋Š” ํ˜ธํ…” ์˜ˆ์•ฝ ํ™•์ธ, ์žฌ์ • ๋ฐ ์ •๋ณด ์ œ๊ณต๊ณผ ๊ฐ™์€ ์„œ๋น„์Šค์—์„œ ๋ณด๋‚ด๋Š” ์ค‘์š”ํ•œ ํŽธ์ง€์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋น„์ฆˆ๋‹ˆ์Šค ๊ด‘๊ณ , ํ• ์ธ์ž…๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” ๊ฑฐ๋ž˜ ์ด๋ฉ”์ผ์ด ๊ฐœ์ธ ์„œ์‹ ๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์ค‘์š”ํ•˜๋‹ค๊ณ  ๋ฏฟ์Šต๋‹ˆ๋‹ค. ์ฃผ๋ฌธ์ด๋‚˜ ํ•ญ๊ณต๊ถŒ ์˜ˆ์•ฝ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ์ฐพ์•„์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๊ณ  ์ด๋Ÿฌํ•œ ํŽธ์ง€๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์„ ์†Œ๋น„ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฌํ•œ ํŽธ์ง€๋Š” ๊ฐ€๊นŒ์ด์— ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ํŽธ์˜๋ฅผ ์œ„ํ•ด ์ž๋™์œผ๋กœ ์—ฌํ–‰, ์ฃผ๋ฌธ, ๊ธˆ์œต, ํ‹ฐ์ผ“, ๋“ฑ๋ก, ๋ฒŒ๊ธˆ ๋“ฑ XNUMX๊ฐ€์ง€ ์ฃผ์š” ๋ฒ”์ฃผ๋กœ ๋‚˜๋ˆ•๋‹ˆ๋‹ค.

์ •๋ณด ํŽธ์ง€๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ๊ทธ๋Ÿฌํ•œ ํŽธ์ง€๋ฅผ ์ฝ์ง€ ์•Š์œผ๋ฉด ์‚ฌ์šฉ์ž์˜ ์‚ถ์— ์ค‘์š”ํ•œ ๋ณ€ํ™”๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์ฆ‰๊ฐ์ ์ธ ์‘๋‹ต์ด ํ•„์š”ํ•˜์ง€ ์•Š์€ ๊ฐ€์žฅ ํฌ๊ณ  ์•„๋งˆ๋„ ๋œ ์ค‘์š”ํ•œ ๊ทธ๋ฃน์ž…๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์ธํ„ฐํŽ˜์ด์Šค์—์„œ๋Š” ์ด๋ฅผ ์†Œ์…œ ๋„คํŠธ์›Œํฌ์™€ ๋‰ด์Šค๋ ˆํ„ฐ๋ผ๋Š” ๋‘ ๊ฐœ์˜ ์Šค๋ ˆ๋“œ๋กœ ์ถ•์†Œํ•˜์—ฌ ๋ฐ›์€ ํŽธ์ง€ํ•จ์„ ์‹œ๊ฐ์ ์œผ๋กœ ์ •๋ฆฌํ•˜๊ณ  ์ค‘์š”ํ•œ ๋ฉ”์‹œ์ง€๋งŒ ํ‘œ์‹œ๋˜๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

์ฐฉ์ทจ

์‹œ์Šคํ…œ ์ˆ˜๊ฐ€ ๋งŽ์œผ๋ฉด ์šด์˜์— ๋งŽ์€ ์–ด๋ ค์›€์ด ๋”ฐ๋ฆ…๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ๋ชจ๋ธ์€ ๋‹ค๋ฅธ ์†Œํ”„ํŠธ์›จ์–ด์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค. ๊ธฐ๋Šฅ์ด ์†์ƒ๋˜๊ณ , ๊ธฐ๊ณ„๊ฐ€ ๊ณ ์žฅ๋‚˜๊ณ , ์ฝ”๋“œ๊ฐ€ ๋น„๋šค์–ด์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ฐ์ดํ„ฐ๋Š” ์ง€์†์ ์œผ๋กœ ๋ณ€๊ฒฝ๋ฉ๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๊ฐ€ ์ถ”๊ฐ€๋˜๊ณ , ์‚ฌ์šฉ์ž ํ–‰๋™ ํŒจํ„ด์ด ๋ณ€ํ˜•๋˜๋ฏ€๋กœ ์ ์ ˆํ•œ ์ง€์›์ด ์—†๋Š” ๋ชจ๋ธ์€ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ์ ์  ๋” ๋‚˜๋น ์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋จธ์‹ ๋Ÿฌ๋‹์ด ์‚ฌ์šฉ์ž์˜ ์‚ถ์— ๋” ๊นŠ์ด ์นจํˆฌํ• ์ˆ˜๋ก ์ƒํƒœ๊ณ„์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์ด ์ปค์ง€๊ณ  ๊ฒฐ๊ณผ์ ์œผ๋กœ ์‹œ์žฅ ์ฐธ๊ฐ€์ž๊ฐ€ ๋” ๋งŽ์€ ๊ธˆ์ „์  ์†์‹ค์ด๋‚˜ ์ด์ต์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์„ ์žŠ์–ด์„œ๋Š” ์•ˆ ๋ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ ์  ๋” ๋งŽ์€ ์˜์—ญ์—์„œ ํ”Œ๋ ˆ์ด์–ด๊ฐ€ ML ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ž‘์—…์— ์ ์‘ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค(์ „ํ˜•์ ์ธ ์˜ˆ๋กœ๋Š” ๊ด‘๊ณ , ๊ฒ€์ƒ‰ ๋ฐ ์ด๋ฏธ ์–ธ๊ธ‰ํ•œ ์ŠคํŒธ ๋ฐฉ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค).

๋˜ํ•œ ๊ธฐ๊ณ„ ํ•™์Šต ์ž‘์—…์—๋Š” ํŠน์ง•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ์˜ ์‚ฌ์†Œํ•œ ๋ณ€ํ™”๋ผ๋„ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋งŽ์€ ์ž‘์—…์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋ช‡ ์ฃผ ๋˜๋Š” ๋ช‡ ๋‹ฌ์ด ๊ฑธ๋ฆด ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ ์ž‘์—…, ์žฌ๊ต์œก, ๋ฐฐํฌ ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋ชจ๋ธ์ด ์ž‘๋™ํ•˜๋Š” ํ™˜๊ฒฝ์ด ๋น ๋ฅด๊ฒŒ ๋ณ€๊ฒฝ๋ ์ˆ˜๋ก ๋ชจ๋ธ์„ ์œ ์ง€ํ•˜๋Š” ๋ฐ ๋” ๋งŽ์€ ๋…ธ๋ ฅ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํŒ€์€ ๋งŽ์€ ์‹œ์Šคํ…œ์„ ๋งŒ๋“ค๊ณ  ๊ทธ๊ฒƒ์— ๋Œ€ํ•ด ๋งŒ์กฑํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ์ƒˆ๋กœ์šด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ๊ธฐํšŒ ์—†์ด ์‹œ์Šคํ…œ์„ ์œ ์ง€ ๊ด€๋ฆฌํ•˜๋Š” ๋ฐ ๊ฑฐ์˜ ๋ชจ๋“  ๋ฆฌ์†Œ์Šค๋ฅผ ์†Œ๋น„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ŠคํŒธ ๋ฐฉ์ง€ ํŒ€์—์„œ ์ด๋Ÿฌํ•œ ์ƒํ™ฉ์„ ๊ฒช์€ ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๊ทธ๋“ค์€ ์ง€์›์„ ์ž๋™ํ™”ํ•ด์•ผ ํ•œ๋‹ค๋Š” ๋ถ„๋ช…ํ•œ ๊ฒฐ๋ก ์„ ๋‚ด๋ ธ์Šต๋‹ˆ๋‹ค.

์˜คํ† ๋ฉ”์ด์…˜

์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ? ์‹ค์ œ๋กœ ๊ฑฐ์˜ ๋ชจ๋“  ๊ฒƒ. ์ €๋Š” ๊ธฐ๊ณ„ ํ•™์Šต ์ธํ”„๋ผ๋ฅผ ์ •์˜ํ•˜๋Š” ๋„ค ๊ฐ€์ง€ ์˜์—ญ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘;
  • ์ถ”๊ฐ€ ํ›ˆ๋ จ;
  • ๋ฐฐํฌ;
  • ํ…Œ์ŠคํŠธ ๋ฐ ๋ชจ๋‹ˆํ„ฐ๋ง.

ํ™˜๊ฒฝ์ด ๋ถˆ์•ˆ์ •ํ•˜๊ณ  ์ง€์†์ ์œผ๋กœ ๋ณ€ํ™”ํ•˜๋Š” ๊ฒฝ์šฐ ๋ชจ๋ธ ์ž์ฒด๋ณด๋‹ค ๋ชจ๋ธ ์ฃผ๋ณ€์˜ ์ „์ฒด ์ธํ”„๋ผ๊ฐ€ ํ›จ์”ฌ ๋” ์ค‘์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์ด ๋“œ๋Ÿฌ๋‚ฉ๋‹ˆ๋‹ค. ์˜ค๋ž˜๋œ ์„ ํ˜• ๋ถ„๋ฅ˜๊ธฐ์ผ ์ˆ˜๋„ ์žˆ์ง€๋งŒ ์˜ฌ๋ฐ”๋ฅธ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•˜๊ณ  ์‚ฌ์šฉ์ž๋กœ๋ถ€ํ„ฐ ์ข‹์€ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์œผ๋ฉด ๋ชจ๋“  ์ถ”๊ฐ€ ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ˜ ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ๋ณด๋‹ค ํ›จ์”ฌ ๋” ์ž˜ ์ž‘๋™ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„

์ด ์ฃผ๊ธฐ๋Š” ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘, ์ถ”๊ฐ€ ๊ต์œก ๋ฐ ๋ฐฐํฌ, ์ฆ‰ ์‹ค์ œ๋กœ ์ „์ฒด ๋ชจ๋ธ ์—…๋ฐ์ดํŠธ ์ฃผ๊ธฐ๋ฅผ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์™œ ์ค‘์š” ํ•จ? ๋ฉ”์ผ์—์„œ ๋“ฑ๋ก ์ผ์ •์„ ํ™•์ธํ•˜์„ธ์š”.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๊ธฐ๊ณ„ ํ•™์Šต ๊ฐœ๋ฐœ์ž๋Š” ๋ด‡์ด ์ด๋ฉ”์ผ์— ๋“ฑ๋กํ•˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๋Š” ๋ด‡ ๋ฐฉ์ง€ ๋ชจ๋ธ์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ์‚ฌ์šฉ์ž๋งŒ ๋‚จ๋Š” ๊ฐ’์œผ๋กœ ๊ทธ๋ž˜ํ”„๊ฐ€ ๋–จ์–ด์ง‘๋‹ˆ๋‹ค. ๋ชจ๋“ ๊ฒƒ์ด ์ข‹์•„! ํ•˜์ง€๋งŒ XNUMX์‹œ๊ฐ„์ด ์ง€๋‚˜๋ฉด ๋ด‡์ด ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์ˆ˜์ •ํ•˜๊ณ  ๋ชจ๋“  ๊ฒƒ์ด ์ •์ƒ์œผ๋กœ ๋Œ์•„์˜ต๋‹ˆ๋‹ค. ์ด ๊ตฌํ˜„์—์„œ ๊ฐœ๋ฐœ์ž๋Š” ๊ธฐ๋Šฅ์„ ์ถ”๊ฐ€ํ•˜๊ณ  ๋ชจ๋ธ์„ ์žฌ๊ต์œกํ•˜๋Š” ๋ฐ ํ•œ ๋‹ฌ์ด ๊ฑธ๋ ธ์ง€๋งŒ ์ŠคํŒธ ๋ฐœ์†ก์ž๋Š” XNUMX์‹œ๊ฐ„ ๋งŒ์— ์ ์‘ํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

๋„ˆ๋ฌด ๊ณ ํ†ต์Šค๋Ÿฌ์šธ ์ •๋„๋กœ ๊ณ ํ†ต์Šค๋Ÿฝ์ง€ ์•Š๊ณ  ๋‚˜์ค‘์— ๋ชจ๋“  ๊ฒƒ์„ ๋‹ค์‹œ ์‹คํ–‰ํ•  ํ•„์š”๊ฐ€ ์—†๋„๋ก ํ•˜๋ ค๋ฉด ๋จผ์ € ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„๊ฐ€ ์–ด๋–ค ๋ชจ์Šต์ผ์ง€, ํ™˜๊ฒฝ์ด ๋ณ€ํ•˜๋ฉด ์–ด๋–ป๊ฒŒ ํ• ์ง€ ์ƒ๊ฐํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘๋ถ€ํ„ฐ ์‹œ์ž‘ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์šฐ๋ฆฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์›๋™๋ ฅ์ž…๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ์ˆ˜์ง‘

์ตœ์‹  ์‹ ๊ฒฝ๋ง์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋” ์ข‹๊ณ  ์‹ค์ œ๋กœ ์ œํ’ˆ ์‚ฌ์šฉ์ž์— ์˜ํ•ด ์ƒ์„ฑ๋œ๋‹ค๋Š” ๊ฒƒ์ด ๋ถ„๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋Š” ๋ฐ์ดํ„ฐ ํ‘œ์‹œ๋ฅผ ํ†ตํ•ด ์šฐ๋ฆฌ์—๊ฒŒ ๋„์›€์„ ์ค„ ์ˆ˜ ์žˆ์ง€๋งŒ ์šฐ๋ฆฌ๋Š” ์ด๊ฒƒ์„ ๋‚จ์šฉํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์–ด๋Š ์‹œ์ ์—์„œ ์‚ฌ์šฉ์ž๋Š” ๋ชจ๋ธ ์™„์„ฑ์— ์ง€์ณ์„œ ๋‹ค๋ฅธ ์ œํ’ˆ์œผ๋กœ ์ „ํ™˜ํ•  ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๊ฐ€์žฅ ํ”ํ•œ ์‹ค์ˆ˜ ์ค‘ ํ•˜๋‚˜(์—ฌ๊ธฐ์„œ๋Š” Andrew Ng๋ฅผ ์–ธ๊ธ‰ํ•ฉ๋‹ˆ๋‹ค)๋Š” ์‹ค์ œ๋กœ ์ž‘์—… ํ’ˆ์งˆ์˜ ์ฃผ์š” ์ฒ™๋„์ธ ์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ์ด ์•„๋‹Œ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์„ธํŠธ์˜ ์ธก์ •ํ•ญ๋ชฉ์— ๋„ˆ๋ฌด ์ง‘์ค‘ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ ์ œํ’ˆ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๋ชจ๋ธ ์ž‘์—…์„ ์ดํ•ดํ•˜์ง€ ๋ชปํ•˜๊ฑฐ๋‚˜ ๋งˆ์Œ์— ๋“ค์ง€ ์•Š์œผ๋ฉด ๋ชจ๋“  ๊ฒƒ์ด ๋ง๊ฐ€์ง‘๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์‚ฌ์šฉ์ž๋Š” ํ•ญ์ƒ ํˆฌํ‘œํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋ฉฐ ํ”ผ๋“œ๋ฐฑ์„ ์œ„ํ•œ ๋„๊ตฌ๊ฐ€ ์ œ๊ณต๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ธˆ์œต๊ณผ ๊ด€๋ จ๋œ ํŽธ์ง€๊ฐ€ ์šฐํŽธํ•จ์— ๋„์ฐฉํ–ˆ๋‹ค๊ณ  ์ƒ๊ฐ๋˜๋ฉด '๊ธˆ์œต'์ด๋ผ๊ณ  ํ‘œ์‹œํ•˜๊ณ  ์‚ฌ์šฉ์ž๊ฐ€ ํด๋ฆญํ•˜์—ฌ ๊ธˆ์œต์ด ์•„๋‹ˆ๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ๋Š” ๋ฒ„ํŠผ์„ ๊ทธ๋ ค์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํ”ผ๋“œ๋ฐฑ ํ’ˆ์งˆ

์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ์˜ ํ’ˆ์งˆ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ๋‹น์‹ ๊ณผ ์‚ฌ์šฉ์ž๋Š” ํ•˜๋‚˜์˜ ๊ฐœ๋…์— ์„œ๋กœ ๋‹ค๋ฅธ ์˜๋ฏธ๋ฅผ ๋‹ด์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ท€ํ•˜์™€ ๊ท€ํ•˜์˜ ์ œํ’ˆ ๊ด€๋ฆฌ์ž๋Š” "๊ธˆ์œต"์ด ์€ํ–‰์—์„œ ๋ณด๋‚ธ ํŽธ์ง€๋ฅผ ์˜๋ฏธํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๊ณ , ์‚ฌ์šฉ์ž๋Š” ์—ฐ๊ธˆ์— ๊ด€ํ•ด ํ• ๋จธ๋‹ˆ๊ฐ€ ๋ณด๋‚ธ ํŽธ์ง€๋„ ๊ธˆ์œต์„ ์˜๋ฏธํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ๋‘˜์งธ, ์•„๋ฌด ๋…ผ๋ฆฌ ์—†์ด ๋ฒ„ํŠผ์„ ๋ˆ„๋ฅด๋Š” ๊ฒƒ์„ ์•„๋ฌด ์ƒ๊ฐ ์—†์ด ์ข‹์•„ํ•˜๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์…‹์งธ, ์‚ฌ์šฉ์ž๋Š” ์ž์‹ ์˜ ๊ฒฐ๋ก ์— ๋Œ€ํ•ด ๊นŠ์€ ์˜คํ•ด๋ฅผ ๋ฐ›์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ ์‹ค์Šต์˜ ๋†€๋ผ์šด ์˜ˆ๋Š” ๋ถ„๋ฅ˜๊ธฐ ๊ตฌํ˜„์ž…๋‹ˆ๋‹ค. ๋‚˜์ด์ง€๋ฆฌ์•„ ์ŠคํŒธ, ์•„ํ”„๋ฆฌ์นด์—์„œ ๊ฐ‘์ž๊ธฐ ๋ฐœ๊ฒฌ๋œ ๋จผ ์นœ์ฒ™์œผ๋กœ๋ถ€ํ„ฐ ์‚ฌ์šฉ์ž์—๊ฒŒ ์ˆ˜๋ฐฑ๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ๊ฐ€์ ธ๊ฐ€๋„๋ก ์š”์ฒญํ•˜๋Š” ๋งค์šฐ ์žฌ๋ฏธ์žˆ๋Š” ์œ ํ˜•์˜ ์ŠคํŒธ์ž…๋‹ˆ๋‹ค. ์ด ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ๊ตฌํ˜„ํ•œ ํ›„ ์šฐ๋ฆฌ๋Š” ์ด๋Ÿฌํ•œ ์ด๋ฉ”์ผ์— ๋Œ€ํ•œ "์ŠคํŒธ ์•„๋‹˜" ํด๋ฆญ ์ˆ˜๋ฅผ ํ™•์ธํ•œ ๊ฒฐ๊ณผ ๊ทธ ์ค‘ 80%๊ฐ€ ํฅ๋ฏธ์ง„์ง„ํ•œ ๋‚˜์ด์ง€๋ฆฌ์•„ ์ŠคํŒธ์ธ ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ๊ทน๋„๋กœ ์†๊ธฐ ์‰ฝ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ๋ฒ„ํŠผ์€ ์‚ฌ๋žŒ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ธŒ๋ผ์šฐ์ €์ธ ๊ฒƒ์ฒ˜๋Ÿผ ๊ฐ€์žฅํ•˜๋Š” ๋ชจ๋“  ์ข…๋ฅ˜์˜ ๋ด‡์— ์˜ํ•ด์„œ๋„ ํด๋ฆญ๋  ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์žŠ์ง€ ๋งˆ์‹ญ์‹œ์˜ค. ๋”ฐ๋ผ์„œ ์›์‹œ ํ”ผ๋“œ๋ฐฑ์€ ํ•™์Šต์— ์ข‹์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด ์ •๋ณด๋กœ ๋ฌด์—‡์„ ํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

์šฐ๋ฆฌ๋Š” ๋‘ ๊ฐ€์ง€ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

  • ์—ฐ๊ฒฐ๋œ ML์˜ ํ”ผ๋“œ๋ฐฑ. ์˜ˆ๋ฅผ ๋“ค์–ด, ์•ž์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ์ด ์ œํ•œ๋œ ์ˆ˜์˜ ์ง•ํ›„๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋น ๋ฅธ ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๋Š” ์˜จ๋ผ์ธ ์•ˆํ‹ฐ ๋ด‡ ์‹œ์Šคํ…œ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๊ทธ ์ดํ›„์— ์ž‘๋™ํ•˜๋Š” ๋‘ ๋ฒˆ์งธ ๋Š๋ฆฐ ์‹œ์Šคํ…œ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž, ๊ทธ์˜ ํ–‰๋™ ๋“ฑ์— ๋Œ€ํ•œ ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ๊ฐ€์žฅ ๋งŽ์€ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๊ฒฐ์ •์ด ๋‚ด๋ ค์ง€๋ฉฐ, ์ด์— ๋”ฐ๋ผ ์ •ํ™•์„ฑ๊ณผ ์™„์„ฑ๋„๊ฐ€ ๋†’์•„์ง‘๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ์˜ ์ž‘๋™ ์ฐจ์ด๋ฅผ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ์ฒซ ๋ฒˆ์งธ ์‹œ์Šคํ…œ์— ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋‹จ์ˆœํ•œ ์‹œ์Šคํ…œ์€ ํ•ญ์ƒ ๋” ๋ณต์žกํ•œ ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ์— ์ ‘๊ทผํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  • ํด๋ฆญ ๋ถ„๋ฅ˜. ๊ฐ ์‚ฌ์šฉ์ž ํด๋ฆญ์„ ๊ฐ„๋‹จํžˆ ๋ถ„๋ฅ˜ํ•˜๊ณ  ์œ ํšจ์„ฑ๊ณผ ์œ ์šฉ์„ฑ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์‚ฌ์šฉ์ž ์†์„ฑ, ์‚ฌ์šฉ์ž ๊ธฐ๋ก, ๋ณด๋‚ธ ์‚ฌ๋žŒ ์†์„ฑ, ํ…์ŠคํŠธ ์ž์ฒด ๋ฐ ๋ถ„๋ฅ˜์ž์˜ ๊ฒฐ๊ณผ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ŠคํŒธ ๋ฐฉ์ง€ ๋ฉ”์ผ์—์„œ ์ด๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์šฐ๋ฆฌ๋Š” ์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ์„ ๊ฒ€์ฆํ•˜๋Š” ์ž๋™ ์‹œ์Šคํ…œ์„ ๊ฐ–๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํ›จ์”ฌ ๋œ ์ž์ฃผ ์žฌ๊ต์œก์„ ๋ฐ›์•„์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹น ์ž‘์—…์€ ๋‹ค๋ฅธ ๋ชจ๋“  ์‹œ์Šคํ…œ์˜ ๊ธฐ์ดˆ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ์šฐ์„  ์ˆœ์œ„๋Š” ์ •๋ฐ€๋„์ž…๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด ๋ถ€์ •ํ™•ํ•œ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ชจ๋ธ ๊ต์œก์€ ๊ฒฐ๊ณผ๋ฅผ ์ดˆ๋ž˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ๋ฅผ ์ •๋ฆฌํ•˜๊ณ  ML ์‹œ์Šคํ…œ์„ ์ถ”๊ฐ€๋กœ ๊ต์œกํ•˜๋Š” ๋™์•ˆ ์‚ฌ์šฉ์ž๋ฅผ ์žŠ์–ด์„œ๋Š” ์•ˆ ๋ฉ๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด ์šฐ๋ฆฌ์—๊ฒŒ๋Š” ๊ทธ๋ž˜ํ”„์— ์žˆ๋Š” ์ˆ˜์ฒœ, ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ์˜ค๋ฅ˜๊ฐ€ ํ†ต๊ณ„์ด๊ณ  ์‚ฌ์šฉ์ž์—๊ฒŒ๋Š” ๋ชจ๋“  ๋ฒ„๊ทธ๊ฐ€ ๋น„๊ทน์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋Š” ์ œํ’ˆ์˜ ์˜ค๋ฅ˜๋ฅผ ์–ด๋–ป๊ฒŒ๋“  ๊ฐ์ˆ˜ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์‚ฌ์‹ค ์™ธ์—๋„ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์€ ํ›„ ๋น„์Šทํ•œ ์ƒํ™ฉ์ด ์•ž์œผ๋กœ ์‚ฌ๋ผ์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๊ธฐ๋Œ€ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์‚ฌ์šฉ์ž์—๊ฒŒ ํˆฌํ‘œํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ML ์‹œ์Šคํ…œ์˜ ๋™์ž‘์„ ์ˆ˜์ •ํ•˜์—ฌ ๊ฐ ํ”ผ๋“œ๋ฐฑ ํด๋ฆญ์— ๋Œ€ํ•œ ๊ฐœ์ธ ๊ฒฝํ—˜์  ๋ฐฉ๋ฒ•์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์€ ํ•ญ์ƒ ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฉ”์ผ์˜ ๊ฒฝ์šฐ ํ•„ํ„ฐ๋ง ๊ธฐ๋Šฅ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์‚ฌ์šฉ์ž์— ๋Œ€ํ•œ ๋ณด๋‚ธ ์‚ฌ๋žŒ ๋ฐ ์ œ๋ชฉ์˜ ํŽธ์ง€.

๋˜ํ•œ ๋‹ค๋ฅธ ์‚ฌ์šฉ์ž๊ฐ€ ๋น„์Šทํ•œ ๋ฌธ์ œ๋ฅผ ๊ฒช์ง€ ์•Š๋„๋ก ๋ฐ˜์ž๋™ ๋˜๋Š” ์ˆ˜๋™ ๋ชจ๋“œ์—์„œ ์ง€์›ํ•  ์ผ๋ถ€ ๋ณด๊ณ ์„œ๋‚˜ ์š”์ฒญ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํ•™์Šต์„ ์œ„ํ•œ ํœด๋ฆฌ์Šคํ‹ฑ

์ด๋Ÿฌํ•œ ํœด๋ฆฌ์Šคํ‹ฑ๊ณผ ๋ชฉ๋ฐœ์—๋Š” ๋‘ ๊ฐ€์ง€ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ๋Š” ๊ณ„์† ์ฆ๊ฐ€ํ•˜๋Š” ๋ชฉ๋ฐœ์˜ ์ˆ˜๋Š” ์žฅ๊ธฐ์ ์œผ๋กœ ํ’ˆ์งˆ๊ณผ ์„ฑ๋Šฅ์€ ๋ฌผ๋ก ์ด๊ณ  ์œ ์ง€ ๊ด€๋ฆฌ๋„ ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‘ ๋ฒˆ์งธ ๋ฌธ์ œ๋Š” ์˜ค๋ฅ˜๊ฐ€ ์ž์ฃผ ๋ฐœ์ƒํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋ช‡ ๋ฒˆ์˜ ํด๋ฆญ๋งŒ์œผ๋กœ ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ํ•™์Šตํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‹ค์Œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ ์šฉํ•˜๋ฉด ์„œ๋กœ ๊ด€๋ จ๋˜์ง€ ์•Š์€ ๋‘ ๊ฐ€์ง€ ํšจ๊ณผ๋ฅผ ํฌ๊ฒŒ ๋ฌด๋ ฅํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

  1. ์šฐ๋ฆฌ๋Š” ์ž„์‹œ ๋ชฉ๋ฐœ์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
  2. ์šฐ๋ฆฌ๋Š” ๊ทธ๊ฒƒ์—์„œ ๋ชจ๋ธ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด๋‚ด๊ณ , ์ˆ˜์‹ ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•˜์—ฌ ์ •๊ธฐ์ ์œผ๋กœ ์ž์ฒด ์—…๋ฐ์ดํŠธ๋ฉ๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์—ฌ๊ธฐ์„œ๋Š” ํ•™์Šต ์„ธํŠธ์˜ ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์ด ์ €ํ•˜๋˜์ง€ ์•Š๋„๋ก ํœด๋ฆฌ์Šคํ‹ฑ์˜ ์ •ํ™•๋„๊ฐ€ ๋†’์€ ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
  3. ๊ทธ๋Ÿฐ ๋‹ค์Œ ๋ชฉ๋ฐœ์„ ํŠธ๋ฆฌ๊ฑฐํ•˜๋„๋ก ๋ชจ๋‹ˆํ„ฐ๋ง์„ ์„ค์ •ํ•˜๊ณ , ์ผ์ • ์‹œ๊ฐ„์ด ์ง€๋‚œ ํ›„ ๋ชฉ๋ฐœ์ด ๋” ์ด์ƒ ์ž‘๋™ํ•˜์ง€ ์•Š๊ณ  ๋ชจ๋ธ์— ์™„์ „ํžˆ ๋ฎ์ด๋ฉด ์•ˆ์ „ํ•˜๊ฒŒ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ œ ์ด ๋ฌธ์ œ๋Š” ๋‹ค์‹œ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๊ทธ๋ž˜์„œ ๋ชฉ๋ฐœ ๊ตฐ๋Œ€๋Š” ๋งค์šฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๊ทธ๋“ค์˜ ์„œ๋น„์Šค๊ฐ€ ๊ธด๊ธ‰ํ•˜๊ณ  ์˜๊ตฌ์ ์ด์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ถ”๊ฐ€ ํ›ˆ๋ จ

์žฌ๊ต์œก์€ ์‚ฌ์šฉ์ž๋‚˜ ๋‹ค๋ฅธ ์‹œ์Šคํ…œ์˜ ํ”ผ๋“œ๋ฐฑ ๊ฒฐ๊ณผ๋กœ ์–ป์€ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•˜๊ณ  ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ธฐ์กด ๋ชจ๋ธ์„ ๊ต์œกํ•˜๋Š” ํ”„๋กœ์„ธ์Šค์ž…๋‹ˆ๋‹ค. ์ถ”๊ฐ€ ๊ต์œก์—๋Š” ๋ช‡ ๊ฐ€์ง€ ๋ฌธ์ œ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  1. ๋ชจ๋ธ์€ ์ถ”๊ฐ€ ๊ต์œก์„ ์ง€์›ํ•˜์ง€ ์•Š๊ณ  ์ฒ˜์Œ๋ถ€ํ„ฐ๋งŒ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ์ž์—ฐ์˜ ์ฑ… ์–ด๋””์—๋„ ์ถ”๊ฐ€ ๊ต์œก์ด ์ƒ์‚ฐ ์ž‘์—…์˜ ์งˆ์„ ํ™•์‹คํžˆ ํ–ฅ์ƒ์‹œํ‚ฌ ๊ฒƒ์ด๋ผ๊ณ  ๊ธฐ๋ก๋˜์–ด ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ข…์ข… ๋ฐ˜๋Œ€ ํ˜„์ƒ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์•…ํ™”๋งŒ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  3. ๋ณ€ํ™”๋Š” ์˜ˆ์ธกํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ์šฐ๋ฆฌ๊ฐ€ ์Šค์Šค๋กœ ํ™•์ธํ•œ ๋‹ค์†Œ ๋ฏธ๋ฌ˜ํ•œ ์ ์ž…๋‹ˆ๋‹ค. A/B ํ…Œ์ŠคํŠธ์—์„œ ์ƒˆ๋กœ์šด ๋ชจ๋ธ์ด ๊ธฐ์กด ๋ชจ๋ธ๊ณผ ์œ ์‚ฌํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ธ๋‹ค๊ณ  ํ•ด์„œ ๋™์ผํ•˜๊ฒŒ ์ž‘๋™ํ•œ๋‹ค๋Š” ์˜๋ฏธ๋Š” ์•„๋‹™๋‹ˆ๋‹ค. ์ด๋“ค์˜ ์ž‘์—…์€ ๋‹จ XNUMX%๋งŒ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์œผ๋ฉฐ ์ด๋กœ ์ธํ•ด ์ƒˆ๋กœ์šด ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์ด๋ฏธ ์ˆ˜์ •๋œ ์ด์ „ ์˜ค๋ฅ˜๊ฐ€ ๋ฐ˜ํ™˜๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์™€ ์‚ฌ์šฉ์ž ๋ชจ๋‘ ํ˜„์žฌ ์˜ค๋ฅ˜๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ด๋ฏธ ์•Œ๊ณ  ์žˆ์œผ๋ฉฐ, ์ƒˆ๋กœ์šด ์˜ค๋ฅ˜๊ฐ€ ๋งŽ์ด ๋ฐœ์ƒํ•˜๋ฉด ์‚ฌ์šฉ์ž๋Š” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ๋™์ž‘์„ ๊ธฐ๋Œ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ฌด์Šจ ์ผ์ด ์ผ์–ด๋‚˜๊ณ  ์žˆ๋Š”์ง€ ์ดํ•ดํ•˜์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ์ถ”๊ฐ€ ํ›ˆ๋ จ์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๋ชจ๋ธ์ด ๊ฐœ์„ ๋˜๊ฑฐ๋‚˜ ์ ์–ด๋„ ์•…ํ™”๋˜์ง€ ์•Š๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ถ”๊ฐ€ ๊ต์œก์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•  ๋•Œ ๊ฐ€์žฅ ๋จผ์ € ๋– ์˜ค๋ฅด๋Š” ๊ฒƒ์€ Active Learning ์ ‘๊ทผ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ๋ฌด์—‡์„ ์˜๋ฏธ ํ•˜๋Š”๊ฐ€? ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ถ„๋ฅ˜์ž๋Š” ์ด๋ฉ”์ผ์ด ๊ธˆ์œต๊ณผ ๊ด€๋ จ๋˜์–ด ์žˆ๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๊ฒฐ์ •ํ•˜๊ณ  ๊ฒฐ์ • ๊ฒฝ๊ณ„ ์ฃผ์œ„์— ๋ ˆ์ด๋ธ”์ด ์ง€์ •๋œ ์˜ˆ์‹œ ์ƒ˜ํ”Œ์„ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํ”ผ๋“œ๋ฐฑ์ด ๋งŽ๊ณ  ์˜จ๋ผ์ธ์œผ๋กœ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•  ์ˆ˜ ์žˆ๋Š” ๊ด‘๊ณ ์—์„œ๋Š” ์ด ๋ฐฉ๋ฒ•์ด ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํ”ผ๋“œ๋ฐฑ์ด ๊ฑฐ์˜ ์—†์œผ๋ฉด ์ƒ์‚ฐ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์— ๋น„ํ•ด ๋งค์šฐ ํŽธํ–ฅ๋œ ์ƒ˜ํ”Œ์„ ์–ป๊ฒŒ ๋˜๋ฉฐ ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž‘๋™ ์ค‘ ๋ชจ๋ธ์˜ ๋™์ž‘์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ๋ถˆ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

์‚ฌ์‹ค, ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ๋Š” ์˜ค๋ž˜๋œ ํŒจํ„ด, ์ด๋ฏธ ์•Œ๋ ค์ง„ ๋ชจ๋ธ์„ ๋ณด์กดํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ํš๋“ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์—ฐ์†์„ฑ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์ข…์ข… ์ถœ์‹œํ•˜๊ธฐ ์œ„ํ•ด ๋งŽ์€ ๋…ธ๋ ฅ์„ ๊ธฐ์šธ์ธ ๋ชจ๋ธ์€ ์ด๋ฏธ ์ž‘๋™ ์ค‘์ด๋ฏ€๋กœ ์„ฑ๋Šฅ์— ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฉ”์ผ์—๋Š” ํŠธ๋ฆฌ, ์„ ํ˜•, ์‹ ๊ฒฝ๋ง ๋“ฑ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๊ฐ๊ฐ์— ๋Œ€ํ•ด ์šฐ๋ฆฌ๋Š” ์ž์ฒด์ ์ธ ์ถ”๊ฐ€ ํ›ˆ๋ จ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ถ”๊ฐ€ ํ›ˆ๋ จ ๊ณผ์ •์—์„œ ์šฐ๋ฆฌ๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์•„๋ž˜์˜ ๋ชจ๋“  ์•Œ๊ณ ๋ฆฌ์ฆ˜์—์„œ ๊ณ ๋ คํ•  ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ๋„ ์ž์ฃผ ์–ป์Šต๋‹ˆ๋‹ค.

์„ ํ˜• ๋ชจ๋ธ

๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ ๋ถ„์„์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋‹ค์Œ ๊ตฌ์„ฑ์š”์†Œ๋กœ๋ถ€ํ„ฐ ์†์‹ค ๋ชจ๋ธ์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.

  • ์ƒˆ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ LogLoss;
  • ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ •๊ทœํ™”ํ•ฉ๋‹ˆ๋‹ค(์ด์ „ ๊ธฐ๋Šฅ์€ ๊ฑด๋“œ๋ฆฌ์ง€ ์•Š์Šต๋‹ˆ๋‹ค).
  • ์šฐ๋ฆฌ๋Š” ๋˜ํ•œ ์˜ค๋ž˜๋œ ํŒจํ„ด์„ ๋ณด์กดํ•˜๊ธฐ ์œ„ํ•ด ์˜ค๋ž˜๋œ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
  • ๊ทธ๋ฆฌ๊ณ  ์•„๋งˆ๋„ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ํ‘œ์ค€์— ๋”ฐ๋ผ ๊ฐ€์ค‘์น˜๊ฐ€ ์ด์ „ ๋ชจ๋ธ์— ๋น„ํ•ด ๋งŽ์ด ๋ณ€ํ•˜์ง€ ์•Š๋„๋ก ๋ณด์žฅํ•˜๋Š” ์กฐํ™” ์ •๊ทœํ™”๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๊ฐ ์†์‹ค ๊ตฌ์„ฑ์š”์†Œ์—๋Š” ๊ณ„์ˆ˜๊ฐ€ ์žˆ์œผ๋ฏ€๋กœ ๊ต์ฐจ ๊ฒ€์ฆ์„ ํ†ตํ•ด ๋˜๋Š” ์ œํ’ˆ ์š”๊ตฌ ์‚ฌํ•ญ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž‘์—…์— ๋Œ€ํ•œ ์ตœ์ ์˜ ๊ฐ’์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๋‚˜๋ฌด

์˜์‚ฌ๊ฒฐ์ • ํŠธ๋ฆฌ๋กœ ๋„˜์–ด๊ฐ€๊ฒ ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํŠธ๋ฆฌ์˜ ์ถ”๊ฐ€ ํ›ˆ๋ จ์„ ์œ„ํ•ด ๋‹ค์Œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ปดํŒŒ์ผํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. ํ”„๋กœ๋•์…˜์—์„œ๋Š” 100~300๊ทธ๋ฃจ์˜ ๋‚˜๋ฌด๋กœ ๊ตฌ์„ฑ๋œ ์ˆฒ์„ ์šด์˜ํ•˜๋ฉฐ, ์ด๋Š” ์˜ค๋ž˜๋œ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค.
  2. ๋งˆ์ง€๋ง‰์— M = 5 ์กฐ๊ฐ์„ ์ œ๊ฑฐํ•˜๊ณ  2M = 10๊ฐœ์˜ ์ƒˆ ์กฐ๊ฐ์„ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ „์ฒด ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ๋Œ€ํ•ด ํ›ˆ๋ จ๋˜์—ˆ์ง€๋งŒ ์ƒˆ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜๊ฐ€ ๋†’๊ธฐ ๋•Œ๋ฌธ์— ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ชจ๋ธ์˜ ์ฆ๋ถ„ ๋ณ€ํ™”๊ฐ€ ๋ณด์žฅ๋ฉ๋‹ˆ๋‹ค.

๋ถ„๋ช…ํžˆ, ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋‚˜๋ฌด์˜ ์ˆ˜๋Š” ํฌ๊ฒŒ ์ฆ๊ฐ€ํ•˜๊ณ , ์‹œ๊ธฐ๋ฅผ ๋งž์ถ”๊ธฐ ์œ„ํ•ด ์ฃผ๊ธฐ์ ์œผ๋กœ ์ค„์—ฌ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์šฐ๋ฆฌ๋Š” ํ˜„์žฌ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” KD(Knowledge Distillation)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ž‘๋™ ์›๋ฆฌ์— ๋Œ€ํ•ด ๊ฐ„๋žตํžˆ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

  1. ์šฐ๋ฆฌ๋Š” ํ˜„์žฌ์˜ "๋ณต์žกํ•œ" ๋ชจ๋ธ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ์ด๋ฅผ ์‹คํ–‰ํ•˜๊ณ  ์ถœ๋ ฅ์—์„œ โ€‹โ€‹ํด๋ž˜์Šค ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์–ป์Šต๋‹ˆ๋‹ค.
  2. ๋‹ค์Œ์œผ๋กœ, ํด๋ž˜์Šค ๋ถ„ํฌ๋ฅผ ๋ชฉํ‘œ ๋ณ€์ˆ˜๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ˜๋ณตํ•˜๋„๋ก ํ•™์ƒ ๋ชจ๋ธ(์ด ๊ฒฝ์šฐ์—๋Š” ๋” ์ ์€ ์ˆ˜์˜ ํŠธ๋ฆฌ๊ฐ€ ์žˆ๋Š” ๋ชจ๋ธ)์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
  3. ์—ฌ๊ธฐ์„œ๋Š” ๋ฐ์ดํ„ฐ ์„ธํŠธ ๋งˆํฌ์—…์„ ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ๋“  ์‚ฌ์šฉํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ ์ž„์˜์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์— ์œ ์˜ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์ „ํˆฌ ์ŠคํŠธ๋ฆผ์˜ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์„ ํ•™์ƒ ๋ชจ๋ธ์˜ ํ›ˆ๋ จ ์ƒ˜ํ”Œ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ํ›ˆ๋ จ ์„ธํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ชจ๋ธ์˜ ์ •ํ™•์„ฑ์„ ๋ณด์žฅํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ์ŠคํŠธ๋ฆผ ์ƒ˜ํ”Œ์€ ํ›ˆ๋ จ ์„ธํŠธ์˜ ํŽธํ–ฅ์„ ๋ณด์ƒํ•˜์—ฌ ์ƒ์‚ฐ ๋ถ„ํฌ์—์„œ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

์ด ๋‘ ๊ธฐ์ˆ (ํŠธ๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ•˜๊ณ  ์ง€์‹ ์ฆ๋ฅ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ฃผ๊ธฐ์ ์œผ๋กœ ํŠธ๋ฆฌ ์ˆ˜๋ฅผ ์ค„์ด๋Š” ๊ฒƒ)์˜ ์กฐํ•ฉ์€ ์ƒˆ๋กœ์šด ํŒจํ„ด์˜ ๋„์ž…๊ณผ ์™„์ „ํ•œ ์—ฐ์†์„ฑ์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

KD์˜ ๋„์›€์œผ๋กœ ์šฐ๋ฆฌ๋Š” ๊ธฐ๋Šฅ ์ œ๊ฑฐ, ๊ณต๋ฐฑ ์ž‘์—… ๋“ฑ ๋ชจ๋ธ ๊ธฐ๋Šฅ์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์ž‘์—…๋„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ €์žฅ๋˜๋Š” ์ค‘์š”ํ•œ ํ†ต๊ณ„ ๊ธฐ๋Šฅ(๋ฐœ์‹ ์ž, ํ…์ŠคํŠธ ํ•ด์‹œ, URL ๋“ฑ)์ด ๋งŽ์ด ์žˆ๋Š”๋ฐ ์‹คํŒจํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ๋ชจ๋ธ์€ ํ›ˆ๋ จ ์„ธํŠธ์—์„œ ์‹คํŒจ ์ƒํ™ฉ์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฌํ•œ ์ด๋ฒคํŠธ ๊ฐœ๋ฐœ์— ์ค€๋น„๊ฐ€ ๋˜์–ด ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ KD์™€ ์ฆ๊ฐ• ๊ธฐ์ˆ ์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์˜ ์ผ๋ถ€๋ฅผ ํ›ˆ๋ จํ•  ๋•Œ ํ•„์š”ํ•œ ๊ธฐ๋Šฅ์„ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ ์žฌ์„ค์ •ํ•˜๊ณ  ์›๋ž˜ ๋ ˆ์ด๋ธ”(ํ˜„์žฌ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ)์„ ๊ฐ€์ ธ์˜ค๋ฉฐ ํ•™์ƒ ๋ชจ๋ธ์€ ์ด ๋ถ„ํฌ๋ฅผ ๋ฐ˜๋ณตํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. .

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

์šฐ๋ฆฌ๋Š” ๋” ์‹ฌ๊ฐํ•œ ๋ชจ๋ธ ์กฐ์ž‘์ด ๋ฐœ์ƒํ• ์ˆ˜๋ก ํ•„์š”ํ•œ ์Šค๋ ˆ๋“œ ์ƒ˜ํ”Œ์˜ ๋น„์œจ์ด ๋” ๋†’์•„์ง„๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ์ž‘์—…์ธ ๊ธฐ๋Šฅ ์ œ๊ฑฐ์—๋Š” ํ๋ฆ„์˜ ์ž‘์€ ๋ถ€๋ถ„๋งŒ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ช‡ ๊ฐ€์ง€ ๊ธฐ๋Šฅ๋งŒ ๋ณ€๊ฒฝ๋˜๊ณ  ํ˜„์žฌ ๋ชจ๋ธ์€ ๋™์ผํ•œ ์„ธํŠธ์—์„œ ํ•™์Šต๋˜์—ˆ์œผ๋ฏ€๋กœ ์ฐจ์ด๊ฐ€ ์ตœ์†Œํ™”๋ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ๋‹จ์ˆœํ™”ํ•˜๋ ค๋ฉด(ํŠธ๋ฆฌ ์ˆ˜๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ์ค„์ž„) ์ด๋ฏธ 50~50๊ฐœ๊ฐ€ ํ•„์š”ํ•˜๋ฉฐ, ๋ชจ๋ธ ์„ฑ๋Šฅ์— ์‹ฌ๊ฐํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ค‘์š”ํ•œ ํ†ต๊ณ„์  ํŠน์ง•์ด ๋ˆ„๋ฝ๋œ ๊ฒฝ์šฐ ์ž‘์—…์„ ํ‰์ค€ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋” ๋งŽ์€ ํ๋ฆ„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ์œ ํ˜•์˜ ๋ฌธ์ž์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ๋ˆ„๋ฝ ๋ฐฉ์ง€ ๋ชจ๋ธ.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

ํŒจ์ŠคํŠธํ…์ŠคํŠธ

FastText๋กœ ๋„˜์–ด๊ฐ€๊ฒ ์Šต๋‹ˆ๋‹ค. ๋‹จ์–ด์˜ ํ‘œํ˜„(์ž„๋ฒ ๋”ฉ)์€ ๋‹จ์–ด ์ž์ฒด์™€ ๋ชจ๋“  ๋ฌธ์ž N-๊ทธ๋žจ(๋ณดํ†ต ํŠธ๋ผ์ด๊ทธ๋žจ)์˜ ์ž„๋ฒ ๋”ฉ ํ•ฉ๊ณ„๋กœ ๊ตฌ์„ฑ๋œ๋‹ค๋Š” ์ ์„ ์ƒ๊ธฐ์‹œ์ผœ ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค. ํŠธ๋ผ์ด๊ทธ๋žจ์ด ์ƒ๋‹นํžˆ ๋งŽ์„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ฒ„ํ‚ท ํ•ด์‹ฑ(Bucket Hashing), ์ฆ‰ ์ „์ฒด ๊ณต๊ฐ„์„ ํŠน์ • ๊ณ ์ • ํ•ด์‹œ๋งต์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋‹จ์–ด์ˆ˜+๋ฒ„ํ‚ท์ˆ˜๋‹น ๋‚ด๋ถ€ ๋ ˆ์ด์–ด์˜ ์ฐจ์›์œผ๋กœ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ์„ ๊ตฌํ•˜๊ฒŒ ๋œ๋‹ค.

์ถ”๊ฐ€ ๊ต์œก์„ ํ†ตํ•ด ๋‹จ์–ด์™€ ํŠธ๋ผ์ด๊ทธ๋žจ์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ธฐํ˜ธ๊ฐ€ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. Facebook์˜ ํ‘œ์ค€ ํ›„์† ๊ต์œก์—์„œ๋Š” ์ค‘์š”ํ•œ ์ผ์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์žˆ๋Š” ์ด์ „ ๊ฐ€์ค‘์น˜๋งŒ ์ƒˆ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์žฌ๊ต์œก๋ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ์€ ์‚ฌ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์ด ์ ‘๊ทผ ๋ฐฉ์‹์—๋Š” ์ƒ์‚ฐ ์‹œ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ด€๋ จํ•˜์—ฌ ์œ„์—์„œ ์„ค๋ช…ํ•œ ๋ชจ๋“  ๋‹จ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ๋ฐ”๋กœ ์šฐ๋ฆฌ๊ฐ€ FastText๋ฅผ ์•ฝ๊ฐ„ ์ˆ˜์ •ํ•œ ์ด์œ ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋ชจ๋“  ์ƒˆ๋กœ์šด ๊ฐ€์ค‘์น˜(๋‹จ์–ด ๋ฐ ํŠธ๋ผ์ด๊ทธ๋žจ)๋ฅผ ์ถ”๊ฐ€ํ•˜๊ณ , ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ๋กœ ์ „์ฒด ํ–‰๋ ฌ์„ ํ™•์žฅํ•˜๊ณ , ์„ ํ˜• ๋ชจ๋ธ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ์กฐํ™” ์ •๊ทœํ™”๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์ด์ „ ๊ฐ€์ค‘์น˜์˜ ๋ฏธ๋ฏธํ•œ ๋ณ€ํ™”๋ฅผ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

ํ˜„์ง€ ์‹œ๊ฐ„

์ปจ๋ฒŒ๋ฃจ์…˜ ๋„คํŠธ์›Œํฌ๋Š” ์ข€ ๋” ๋ณต์žกํ•ฉ๋‹ˆ๋‹ค. CNN์—์„œ ๋งˆ์ง€๋ง‰ ๋ ˆ์ด์–ด๊ฐ€ ์™„์„ฑ๋˜๋ฉด ๋ฌผ๋ก  ์กฐํ™” ์ •๊ทœํ™”๋ฅผ ์ ์šฉํ•˜๊ณ  ์—ฐ์†์„ฑ์„ ๋ณด์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ „์ฒด ๋„คํŠธ์›Œํฌ์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ํ›ˆ๋ จ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ ์ด๋Ÿฌํ•œ ์ •๊ทœํ™”๋Š” ๋” ์ด์ƒ ๋ชจ๋“  ๋ ˆ์ด์–ด์— ์ ์šฉํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ Triplet Loss(์›๋ณธ ๊ธฐ์‚ฌ).

์‚ผ์ค‘ ์†์‹ค

ํ”ผ์‹ฑ ๋ฐฉ์ง€ ์ž‘์—…์„ ์˜ˆ๋กœ ๋“ค์–ด ์‚ผ์ค‘ ์†์‹ค์„ ์ผ๋ฐ˜์ ์ธ ์šฉ์–ด๋กœ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์šฐ๋ฆฌ ๋กœ๊ณ ์™€ ๋‹ค๋ฅธ ํšŒ์‚ฌ ๋กœ๊ณ ์˜ ๊ธ์ •์ ์ด๊ณ  ๋ถ€์ •์ ์ธ ์˜ˆ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ฒซ ๋ฒˆ์งธ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ณ  ๋‘ ๋ฒˆ์งธ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ตœ๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค. ํด๋ž˜์Šค์˜ ์••์ถ•์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์ž‘์€ ๊ฐ„๊ฒฉ์œผ๋กœ ์ด๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๋„คํŠธ์›Œํฌ๋ฅผ ์ถ”๊ฐ€๋กœ ํ›ˆ๋ จ์‹œํ‚ค๋ฉด ๋ฉ”ํŠธ๋ฆญ ๊ณต๊ฐ„์ด ์™„์ „ํžˆ ๋ฐ”๋€Œ๊ณ  ์ด์ „ ๊ณต๊ฐ„๊ณผ ์™„์ „ํžˆ ํ˜ธํ™˜๋˜์ง€ ์•Š๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ฒกํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋ฌธ์ œ์—์„œ ์‹ฌ๊ฐํ•œ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํ›ˆ๋ จ ์ค‘์— ์ด์ „ ์ž„๋ฒ ๋”ฉ์„ ํ˜ผํ•ฉํ•ฉ๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” ํ›ˆ๋ จ ์„ธํŠธ์— ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ–ˆ์œผ๋ฉฐ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ชจ๋ธ์˜ ๋‘ ๋ฒˆ์งธ ๋ฒ„์ „์„ ํ›ˆ๋ จํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘ ๋ฒˆ์งธ ๋‹จ๊ณ„์—์„œ๋Š” ๋„คํŠธ์›Œํฌ๋ฅผ ์ถ”๊ฐ€๋กœ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค(๋ฏธ์„ธ ์กฐ์ •). ๋จผ์ € ๋งˆ์ง€๋ง‰ ๋ ˆ์ด์–ด๊ฐ€ ์™„์„ฑ๋˜๊ณ  ์ „์ฒด ๋„คํŠธ์›Œํฌ๊ฐ€ ๊ณ ์ • ํ•ด์ œ๋ฉ๋‹ˆ๋‹ค. ํŠธ๋ฆฌํ”Œ๋ ›์„ ๊ตฌ์„ฑํ•˜๋Š” ๊ณผ์ •์—์„œ ์šฐ๋ฆฌ๋Š” ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ž„๋ฒ ๋”ฉ์˜ ์ผ๋ถ€๋งŒ ๊ณ„์‚ฐํ•˜๊ณ  ๋‚˜๋จธ์ง€๋Š” ์ด์ „ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ถ”๊ฐ€ ํ•™์Šต ๊ณผ์ •์—์„œ ๋ฉ”ํŠธ๋ฆญ ๊ณต๊ฐ„ v1๊ณผ v2์˜ ํ˜ธํ™˜์„ฑ์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. ์กฐํ™” ์ •๊ทœํ™”์˜ ๊ณ ์œ ํ•œ ๋ฒ„์ „์ž…๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

์ „์ฒด ์•„ํ‚คํ…์ฒ˜

์ŠคํŒธ ๋ฐฉ์ง€๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ „์ฒด ์‹œ์Šคํ…œ์„ ์˜ˆ๋กœ ๋“ค๋ฉด ๋ชจ๋ธ์€ ๊ฒฉ๋ฆฌ๋˜์ง€ ์•Š๊ณ  ์„œ๋กœ ์ค‘์ฒฉ๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” CNN๊ณผ Fast Text๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์‚ฌ์ง„, ํ…์ŠคํŠธ ๋ฐ ๊ธฐํƒ€ ๊ธฐ๋Šฅ์„ ์ดฌ์˜ํ•˜๊ณ  ์ž„๋ฒ ๋”ฉ์„ ์–ป์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์œผ๋กœ ๋‹ค์–‘ํ•œ ํด๋ž˜์Šค(๋ฌธ์ž ์œ ํ˜•, ์ŠคํŒธ, ๋กœ๊ณ  ์กด์žฌ ์—ฌ๋ถ€)์— ๋Œ€ํ•œ ์ ์ˆ˜๋ฅผ ์ œ๊ณตํ•˜๋Š” ์ž„๋ฒ ๋”ฉ ์œ„์— ๋ถ„๋ฅ˜์ž๊ฐ€ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค. ์‹ ํ˜ธ์™€ ํ‘œ์ง€ํŒ์€ ์ตœ์ข… ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๊ธฐ ์œ„ํ•ด ์ด๋ฏธ ๋‚˜๋ฌด ์ˆฒ์œผ๋กœ ๋“ค์–ด๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ฒด๊ณ„์˜ ๊ฐœ๋ณ„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์›์‹œ ํ˜•์‹์œผ๋กœ ์˜์‚ฌ ๊ฒฐ์ • ํŠธ๋ฆฌ์— ๊ณต๊ธ‰ํ•˜๋Š” ๋Œ€์‹  ์‹œ์Šคํ…œ ๊ฒฐ๊ณผ๋ฅผ ๋” ์ž˜ ํ•ด์„ํ•˜๊ณ  ๋ฌธ์ œ๊ฐ€ ์žˆ๋Š” ๊ฒฝ์šฐ ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ๋ณด๋‹ค ๊ตฌ์ฒด์ ์œผ๋กœ ์žฌ๊ต์œกํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๊ฒฐ๊ณผ์ ์œผ๋กœ ์šฐ๋ฆฌ๋Š” ๋ชจ๋“  ์ˆ˜์ค€์—์„œ ์—ฐ์†์„ฑ์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. CNN๊ณผ Fast Text์˜ ์ตœํ•˜์œ„ ์ˆ˜์ค€์—์„œ๋Š” ์กฐํ™” ์ •๊ทœํ™”๋ฅผ ์‚ฌ์šฉํ•˜๊ณ , ์ค‘๊ฐ„ ๋ถ„๋ฅ˜๊ธฐ์— ๋Œ€ํ•ด์„œ๋Š” ํ™•๋ฅ  ๋ถ„ํฌ์˜ ์ผ๊ด€์„ฑ์„ ์œ„ํ•ด ์กฐํ™” ์ •๊ทœํ™”์™€ ์†๋„ ๋ณด์ •๋„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์Œ, ํŠธ๋ฆฌ ๋ถ€์ŠคํŒ…์€ ์ ์ง„์ ์œผ๋กœ ํ›ˆ๋ จ๋˜๊ฑฐ๋‚˜ Knowledge Distillation์„ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค.

์ผ๋ฐ˜์ ์œผ๋กœ ์ด๋Ÿฌํ•œ ์ค‘์ฒฉ๋œ ๊ธฐ๊ณ„ ํ•™์Šต ์‹œ์Šคํ…œ์„ ์œ ์ง€ํ•˜๋Š” ๊ฒƒ์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์–ด๋ ค์šด ์ผ์ž…๋‹ˆ๋‹ค. ํ•˜์œ„ ์ˆ˜์ค€์˜ ๋ชจ๋“  ๊ตฌ์„ฑ ์š”์†Œ๊ฐ€ ์œ„์˜ ์ „์ฒด ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ์—…๋ฐ์ดํŠธ๋กœ ์ด์–ด์ง€๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ์˜ ์„ค์ •์—์„œ๋Š” ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ๊ฐ€ ์•ฝ๊ฐ„ ๋ณ€๊ฒฝ๋˜๊ณ  ์ด์ „ ๊ตฌ์„ฑ ์š”์†Œ์™€ ํ˜ธํ™˜๋˜๋ฏ€๋กœ ์ „์ฒด ๊ตฌ์กฐ๋ฅผ ๋‹ค์‹œ ๊ต์œกํ•  ํ•„์š” ์—†์ด ์ „์ฒด ์‹œ์Šคํ…œ์„ ํ•˜๋‚˜์”ฉ ์—…๋ฐ์ดํŠธํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ์‹ฌ๊ฐํ•œ ์˜ค๋ฒ„ํ—ค๋“œ ์—†์ด ์ง€์›ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฐฐํฌ

๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ถ”๊ฐ€ ๊ต์œก์— ๋Œ€ํ•ด ๋…ผ์˜ํ–ˆ์œผ๋ฉฐ ์ด์ œ ํ”„๋กœ๋•์…˜ ํ™˜๊ฒฝ์— ๋ฐฐํฌํ•˜๋Š” ๋‹จ๊ณ„๋กœ ๋„˜์–ด๊ฐ‘๋‹ˆ๋‹ค.

A/B ํ…Œ์ŠคํŠธ

์•ž์„œ ๋งํ–ˆ๋“ฏ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๊ณผ์ •์—์„œ ํŽธํ–ฅ๋œ ํ‘œ๋ณธ์„ ์–ป๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉฐ, ์ด๋กœ ์ธํ•ด ๋ชจ๋ธ์˜ ์ƒ์‚ฐ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋ฐฐํฌ ์‹œ ์‹ค์ œ ์ƒํ™ฉ์ด ์–ด๋–ป๊ฒŒ ์ง„ํ–‰๋˜๋Š”์ง€ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์„ ์ด์ „ ๋ฒ„์ „๊ณผ ๋น„๊ตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, A/B ํ…Œ์ŠคํŠธ๋ฅผ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ฐจํŠธ๋ฅผ ์ถœ์‹œํ•˜๊ณ  ๋ถ„์„ํ•˜๋Š” ๊ณผ์ •์€ ๋งค์šฐ ์ผ์ƒ์ ์ด๋ฉฐ ์‰ฝ๊ฒŒ ์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ ์‘๋‹ต ๋ฐ ์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ์— ๋Œ€ํ•ด ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ์ง€ํ‘œ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๋™์‹œ์— ์‚ฌ์šฉ์ž์˜ 5%, 30%, 50% ๋ฐ 100%๋ฅผ ๋Œ€์ƒ์œผ๋กœ ๋ชจ๋ธ์„ ์ ์ง„์ ์œผ๋กœ ์ถœ์‹œํ•ฉ๋‹ˆ๋‹ค. ์‹ฌ๊ฐํ•œ ์ด์ƒ๊ฐ’์ด ์žˆ๋Š” ๊ฒฝ์šฐ ์ž๋™์œผ๋กœ ๋ชจ๋ธ์„ ๋กค๋ฐฑํ•˜๊ณ , ๋‹ค๋ฅธ ๊ฒฝ์šฐ์—๋Š” ์ถฉ๋ถ„ํ•œ ์ˆ˜์˜ ์‚ฌ์šฉ์ž ํด๋ฆญ์„ ์ˆ˜์ง‘ํ•œ ํ›„ ๋น„์œจ์„ ๋†’์ด๊ธฐ๋กœ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์šฐ๋ฆฌ๋Š” ์™„์ „ํžˆ ์ž๋™์œผ๋กœ ์‚ฌ์šฉ์ž์˜ 50%์—๊ฒŒ ์ƒˆ ๋ชจ๋ธ์„ ์ œ๊ณตํ•˜๊ณ  ์ „์ฒด ์‚ฌ์šฉ์ž์— ๋Œ€ํ•œ ์ถœ์‹œ๋Š” ์‚ฌ๋žŒ์ด ์Šน์ธํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๋‹จ, ์ด ๋‹จ๊ณ„๋Š” ์ž๋™ํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ A/B ํ…Œ์ŠคํŠธ ํ”„๋กœ์„ธ์Šค์—๋Š” ์ตœ์ ํ™”์˜ ์—ฌ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์‹ค ๋ชจ๋“  A/B ํ…Œ์ŠคํŠธ๋Š” ์ƒ๋‹นํžˆ ๊ธธ๊ธฐ ๋•Œ๋ฌธ์—(์šฐ๋ฆฌ์˜ ๊ฒฝ์šฐ ํ”ผ๋“œ๋ฐฑ ์–‘์— ๋”ฐ๋ผ 6~24์‹œ๊ฐ„ ์†Œ์š”) ๋น„์šฉ์ด ๋งŽ์ด ๋“ค๊ณ  ๋ฆฌ์†Œ์Šค๋„ ์ œํ•œ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ A/B ํ…Œ์ŠคํŠธ์˜ ์ „์ฒด ์‹œ๊ฐ„์„ ๊ทผ๋ณธ์ ์œผ๋กœ ๊ฐ€์†ํ™”ํ•˜๋ ค๋ฉด ์ถฉ๋ถ„ํžˆ ๋†’์€ ๋น„์œจ์˜ ํ…Œ์ŠคํŠธ ํ๋ฆ„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค(์ž‘์€ ๋น„์œจ๋กœ ์ธก์ •ํ•ญ๋ชฉ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ ์ƒ˜ํ”Œ์„ ๋ชจ์ง‘ํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์ด ๋งค์šฐ ์˜ค๋ž˜ ๊ฑธ๋ฆด ์ˆ˜ ์žˆ์Œ). A/B ์Šฌ๋กฏ ์ˆ˜๋Š” ๊ทนํžˆ ์ œํ•œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ถ„๋ช…ํžˆ ์šฐ๋ฆฌ๋Š” ๊ฐ€์žฅ ์œ ๋งํ•œ ๋ชจ๋ธ๋งŒ ํ…Œ์ŠคํŠธํ•ด์•ผ ํ•˜๋ฉฐ, ๊ทธ ์ค‘ ์ถ”๊ฐ€ ํ›ˆ๋ จ ๊ณผ์ •์—์„œ ์ƒ๋‹นํžˆ ๋งŽ์€ ๊ฒƒ์„ ์–ป์Šต๋‹ˆ๋‹ค.

์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์šฐ๋ฆฌ๋Š” A/B ํ…Œ์ŠคํŠธ์˜ ์„ฑ๊ณต์„ ์˜ˆ์ธกํ•˜๋Š” ๋ณ„๋„์˜ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ํ›ˆ๋ จ ์„ธํŠธ, ์ง€์—ฐ๋œ ์„ธํŠธ ๋ฐ ์ŠคํŠธ๋ฆผ์˜ ์ƒ˜ํ”Œ์— ๋Œ€ํ•œ ์˜์‚ฌ ๊ฒฐ์ • ํ†ต๊ณ„, ์ •๋ฐ€๋„, ์žฌํ˜„์œจ ๋ฐ ๊ธฐํƒ€ ์ธก์ •ํ•ญ๋ชฉ์„ ๊ธฐ๋Šฅ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ํœด๋ฆฌ์Šคํ‹ฑ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ˜„์žฌ ์ƒ์‚ฐ ์ค‘์ธ ๋ชจ๋ธ๊ณผ ๋ชจ๋ธ์„ ๋น„๊ตํ•˜๊ณ  ๋ชจ๋ธ์˜ ๋ณต์žก์„ฑ์„ ๊ณ ๋ คํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋“  ๊ธฐ๋Šฅ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ…Œ์ŠคํŠธ ๊ธฐ๋ก์— ๋Œ€ํ•ด ํ›ˆ๋ จ๋œ ๋ถ„๋ฅ˜์ž๋Š” ํ›„๋ณด ๋ชจ๋ธ(์šฐ๋ฆฌ์˜ ๊ฒฝ์šฐ ๋‚˜๋ฌด ์ˆฒ)์„ ํ‰๊ฐ€ํ•˜๊ณ  A/B ํ…Œ์ŠคํŠธ์— ์‚ฌ์šฉํ•  ๋ชจ๋ธ์„ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๊ตฌํ˜„ ๋‹น์‹œ ์ด ์ ‘๊ทผ ๋ฐฉ์‹์„ ํ†ตํ•ด ์„ฑ๊ณต์ ์ธ A/B ํ…Œ์ŠคํŠธ ํšŸ์ˆ˜๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ๋Š˜๋ฆด ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

ํ…Œ์ŠคํŠธ ๋ฐ ๋ชจ๋‹ˆํ„ฐ๋ง

ํ…Œ์ŠคํŠธ์™€ ๋ชจ๋‹ˆํ„ฐ๋ง์€ ์ด์ƒํ•˜๊ฒŒ๋„ ์šฐ๋ฆฌ์˜ ๊ฑด๊ฐ•์— ํ•ด๋ฅผ ๋ผ์น˜์ง€ ์•Š์œผ๋ฉฐ ์˜คํžˆ๋ ค ๊ฑด๊ฐ•์„ ๊ฐœ์„ ํ•˜๊ณ  ๋ถˆํ•„์š”ํ•œ ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ๋œ์–ด์ค๋‹ˆ๋‹ค. ํ…Œ์ŠคํŠธ๋ฅผ ํ†ตํ•ด ์˜ค๋ฅ˜๋ฅผ ์˜ˆ๋ฐฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ชจ๋‹ˆํ„ฐ๋ง์„ ํ†ตํ•ด ์˜ค๋ฅ˜๋ฅผ ์ ์‹œ์— ๊ฐ์ง€ํ•˜์—ฌ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์กฐ๋งŒ๊ฐ„ ์‹œ์Šคํ…œ์ด ํ•ญ์ƒ ์‹ค์ˆ˜๋ฅผ ํ•˜๊ฒŒ ๋œ๋‹ค๋Š” ์ ์„ ์—ฌ๊ธฐ์„œ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋“  ์†Œํ”„ํŠธ์›จ์–ด์˜ ๊ฐœ๋ฐœ ์ฃผ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ ์ดˆ๊ธฐ์—๋Š” ๋ชจ๋“  ๊ฒƒ์ด ์•ˆ์ •๋˜๊ณ  ์ฃผ์š” ํ˜์‹  ๋‹จ๊ณ„๊ฐ€ ์™„๋ฃŒ๋  ๋•Œ๊นŒ์ง€ ํ•ญ์ƒ ๋งŽ์€ ๋ฒ„๊ทธ๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ์—”ํŠธ๋กœํ”ผ๋Š” ํฐ ํƒ€๊ฒฉ์„ ๋ฐ›๊ณ  ์˜ค๋ฅ˜๊ฐ€ ๋‹ค์‹œ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ œ๊ฐ€ ์ฒ˜์Œ์— ์ด์•ผ๊ธฐํ–ˆ๋˜ ์ฃผ๋ณ€ ๊ตฌ์„ฑ ์š”์†Œ์˜ ์„ฑ๋Šฅ ์ €ํ•˜์™€ ๋ฐ์ดํ„ฐ ๋ณ€๊ฒฝ์œผ๋กœ ์ธํ•ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค.

์—ฌ๊ธฐ์„œ ์ €๋Š” ๋ชจ๋“  ๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์ด ์ „์ฒด ์ˆ˜๋ช…์ฃผ๊ธฐ ๋™์•ˆ ์ด์ต์˜ ๊ด€์ ์—์„œ ๊ณ ๋ ค๋˜์–ด์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ์ง€์ ํ•˜๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜ ๊ทธ๋ž˜ํ”„๋Š” ์‹œ์Šคํ…œ์ด ํฌ๊ท€ํ•œ ์œ ํ˜•์˜ ์ŠคํŒธ์„ ํฌ์ฐฉํ•˜๊ธฐ ์œ„ํ•ด ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์˜ˆ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค(๊ทธ๋ž˜ํ”„์˜ ์„ ์€ XNUMX์— ๊ฐ€๊น์Šต๋‹ˆ๋‹ค). ์–ด๋Š ๋‚ , ๊ทธ๋…€๋Š” ์ž˜๋ชป ์บ์‹œ๋œ ์†์„ฑ์œผ๋กœ ์ธํ•ด ๋ฏธ์ณ๋ฒ„๋ ธ์Šต๋‹ˆ๋‹ค. ๋‹คํ–‰ํžˆ๋„ ๋น„์ •์ƒ์ ์ธ ๋ฐœ๋™์— ๋Œ€ํ•œ ๋ชจ๋‹ˆํ„ฐ๋ง์ด ์—†์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์‹œ์Šคํ…œ์€ ์˜์‚ฌ๊ฒฐ์ • ๊ฒฝ๊ณ„์˜ '์ŠคํŒธ' ํด๋”์— ๋Œ€๋Ÿ‰์˜ ํŽธ์ง€๋ฅผ ์ €์žฅํ•˜๊ธฐ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”๋กœ์žก์•˜์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์‹œ์Šคํ…œ์€ ์ด๋ฏธ XNUMX๋…„์ด ์ง€๋‚˜๋„ ๋ณด์ƒ์„ ๋ฐ›์„ ์ˆ˜ ์—†์„ ์ •๋„๋กœ ๋งŽ์€ ์‹ค์ˆ˜๋ฅผ ์ €์งˆ๋ €์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด๋Š” ๋ชจ๋ธ์˜ ๋ผ์ดํ”„์‚ฌ์ดํด ์ธก๋ฉด์—์„œ ๋ณผ ๋•Œ ์™„์ „ํ•œ ์‹คํŒจ์ž…๋‹ˆ๋‹ค.

Mail.ru Mail์—์„œ ๊ธฐ๊ณ„ ํ•™์Šต ์šด์˜

๋”ฐ๋ผ์„œ ๋ชจ๋‹ˆํ„ฐ๋ง๊ณผ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ์ผ์ด ๋ชจ๋ธ์˜ ์‚ถ์—์„œ ํ•ต์‹ฌ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ‘œ์ค€์ ์ด๊ณ  ๋ช…ํ™•ํ•œ ์ง€ํ‘œ ์™ธ์—๋„ ๋ชจ๋ธ ์‘๋‹ต ๋ฐ ์ ์ˆ˜์˜ ๋ถ„ํฌ๋Š” ๋ฌผ๋ก  ์ฃผ์š” ๊ธฐ๋Šฅ ๊ฐ’์˜ ๋ถ„ํฌ๋„ ๊ณ ๋ คํ•ฉ๋‹ˆ๋‹ค. KL ๋‹ค์ด๋ฒ„์ „์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ํ˜„์žฌ ๋ถ„ํฌ๋ฅผ ๊ณผ๊ฑฐ ๋ถ„ํฌ์™€ ๋น„๊ตํ•˜๊ฑฐ๋‚˜ A/B ํ…Œ์ŠคํŠธ ๊ฐ’์„ ๋‚˜๋จธ์ง€ ์ŠคํŠธ๋ฆผ๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์–ด ๋ชจ๋ธ์˜ ์ด์ƒ ํ˜„์ƒ์„ ๋ฐœ๊ฒฌํ•˜๊ณ  ์ ์‹œ์— ๋ณ€๊ฒฝ ์‚ฌํ•ญ์„ ๋กค๋ฐฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ํ–ฅํ›„ ๋ชจ๋‹ˆํ„ฐ๋ง์— ์‚ฌ์šฉํ•  ๊ฐ„๋‹จํ•œ ๊ฒฝํ—˜์  ๋ฐฉ๋ฒ•์ด๋‚˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ์Šคํ…œ์˜ ์ฒซ ๋ฒˆ์งธ ๋ฒ„์ „์„ ์ถœ์‹œํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํŠน์ • ์˜จ๋ผ์ธ ์ƒ์ ์˜ ์ผ๋ฐ˜ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜์—ฌ NER ๋ชจ๋ธ์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ณ  ๋ถ„๋ฅ˜๊ธฐ ์ ์šฉ ๋ฒ”์œ„๊ฐ€ NER ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜์—ฌ ๋–จ์–ด์ง€๋ฉด ๊ทธ ์ด์œ ๋ฅผ ์ดํ•ดํ•ฉ๋‹ˆ๋‹ค. ํœด๋ฆฌ์Šคํ‹ฑ์˜ ๋˜ ๋‹ค๋ฅธ ์œ ์šฉํ•œ ํ™œ์šฉ๋ฒ•!

๊ฒฐ๊ณผ

๊ธฐ์‚ฌ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋ฅผ ๋‹ค์‹œ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

  • Fibdeck. ์šฐ๋ฆฌ๋Š” ํ•ญ์ƒ ์‚ฌ์šฉ์ž์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ์šฐ๋ฆฌ์˜ ์‹ค์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ๋ฐ›์•„๋“ค์ผ์ง€, ์–ด๋–ป๊ฒŒ ๋ณด๊ณ ํ•  ์ˆ˜ ์žˆ์„์ง€ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๋Š” ํ›ˆ๋ จ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ˆœ์ˆ˜ํ•œ ํ”ผ๋“œ๋ฐฑ ์†Œ์Šค๊ฐ€ ์•„๋‹ˆ๋ฉฐ ๋ณด์กฐ ML ์‹œ์Šคํ…œ์˜ ๋„์›€์œผ๋กœ ์ด๋ฅผ ์ œ๊ฑฐํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ์žŠ์ง€ ๋งˆ์‹ญ์‹œ์˜ค. ์‚ฌ์šฉ์ž๋กœ๋ถ€ํ„ฐ ์‹ ํ˜ธ๋ฅผ ์ˆ˜์ง‘ํ•  ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ ์—ฐ๊ฒฐ๋œ ์‹œ์Šคํ…œ๊ณผ ๊ฐ™์€ ๋Œ€์ฒด ํ”ผ๋“œ๋ฐฑ ์†Œ์Šค๋ฅผ ์ฐพ์Šต๋‹ˆ๋‹ค.
  • ์ถ”๊ฐ€ ํ›ˆ๋ จ. ์—ฌ๊ธฐ์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ์—ฐ์†์„ฑ์ด๋ฏ€๋กœ ํ˜„์žฌ ์ƒ์‚ฐ ๋ชจ๋ธ์— ์˜์กดํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์กฐํ™” ์ •๊ทœํ™” ๋ฐ ์œ ์‚ฌํ•œ ํŠธ๋ฆญ์œผ๋กœ ์ธํ•ด ์ด์ „ ๋ชจ๋ธ๊ณผ ํฌ๊ฒŒ ๋‹ค๋ฅด์ง€ ์•Š๋„๋ก ์ƒˆ ๋ชจ๋ธ์„ ๊ต์œกํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐฐํฌ. ์ธก์ •ํ•ญ๋ชฉ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ž๋™ ๋ฐฐํฌ๋Š” ๋ชจ๋ธ ๊ตฌํ˜„ ์‹œ๊ฐ„์„ ํฌ๊ฒŒ ์ค„์—ฌ์ค๋‹ˆ๋‹ค. ํŽธ์•ˆํ•œ ์ˆ˜๋ฉด๊ณผ ์ƒ์‚ฐ์ ์ธ ์ฃผ๋ง์„ ์œ„ํ•ด์„œ๋Š” ํ†ต๊ณ„ ๋ฐ ์˜์‚ฌ ๊ฒฐ์ • ๋ถ„ํฌ, ์‚ฌ์šฉ์ž ๋‚™์ƒ ํšŸ์ˆ˜๋ฅผ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค.

๊ธ€์Ž„, ์ด๊ฒƒ์ด ML ์‹œ์Šคํ…œ์„ ๋” ๋น ๋ฅด๊ฒŒ ๊ฐœ์„ ํ•˜๊ณ , ๋” ๋น ๋ฅด๊ฒŒ ์‹œ์žฅ์— ์ถœ์‹œํ•˜๊ณ , ๋” ์•ˆ์ •์ ์ด๊ณ  ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ๋œ ๋ฐ›๋Š” ๋ฐ ๋„์›€์ด ๋˜๊ธฐ๋ฅผ ๋ฐ”๋ž๋‹ˆ๋‹ค.

์ถœ์ฒ˜ : habr.com

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€