Sber.DS๋Š” ์ฝ”๋“œ ์—†์ด๋„ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.

์–ด๋–ค ๋‹ค๋ฅธ ํ”„๋กœ์„ธ์Šค๋ฅผ ์ž๋™ํ™”ํ•  ์ˆ˜ ์žˆ๋Š”์ง€์— ๋Œ€ํ•œ ์•„์ด๋””์–ด์™€ ํšŒ์˜๊ฐ€ ๋งค์ผ ๋‹ค์–‘ํ•œ ๊ทœ๋ชจ์˜ ๊ธฐ์—…์—์„œ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐ ๋งŽ์€ ์‹œ๊ฐ„์ด ์†Œ์š”๋  ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค ์™ธ์—๋„ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๊ณ  ์–ป์€ ๊ฒฐ๊ณผ๊ฐ€ ๋ฌด์ž‘์œ„๊ฐ€ ์•„๋‹Œ์ง€ ํ™•์ธํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์„ ํˆฌ์žํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌํ˜„ ํ›„์—๋Š” ๋ชจ๋“  ๋ชจ๋ธ์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ณ  ์ •๊ธฐ์ ์œผ๋กœ ํ™•์ธํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด๋Š” ๊ทœ๋ชจ์— ๊ด€๊ณ„์—†์ด ๋ชจ๋“  ํšŒ์‚ฌ์—์„œ ์™„๋ฃŒํ•ด์•ผ ํ•˜๋Š” ๋ชจ๋“  ๋‹จ๊ณ„์ž…๋‹ˆ๋‹ค. Sberbank์˜ ๊ทœ๋ชจ์™€ ์œ ์‚ฐ์— ๊ด€ํ•ด ์ด์•ผ๊ธฐํ•˜๋ฉด ๋ฏธ์„ธ ์กฐ์ • ํšŸ์ˆ˜๊ฐ€ ํฌ๊ฒŒ ๋Š˜์–ด๋‚ฉ๋‹ˆ๋‹ค. 2019๋…„ ๋ง๊นŒ์ง€ Sber๋Š” ์ด๋ฏธ 2000๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๊ณ , ์‚ฐ์—… ์‹œ์Šคํ…œ๊ณผ ํ†ตํ•ฉํ•˜๊ณ , ๋ชจ๋ธ ๊ตฌ์ถ•์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ๋งˆํŠธ๋ฅผ ๊ฐœ๋ฐœํ•˜๊ณ , ํด๋Ÿฌ์Šคํ„ฐ์—์„œ์˜ ์ž‘๋™์„ ์ œ์–ดํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

Sber.DS๋Š” ์ฝ”๋“œ ์—†์ด๋„ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.

์šฐ๋ฆฌ ํŒ€์€ Sber.DS ํ”Œ๋žซํผ์„ ๊ฐœ๋ฐœํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ๊ณ„ ํ•™์Šต ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ  ๊ฐ€์„ค ํ…Œ์ŠคํŠธ ํ”„๋กœ์„ธ์Šค์˜ ์†๋„๋ฅผ ๋†’์ด๋ฉฐ ์›์น™์ ์œผ๋กœ ๋ชจ๋ธ ๊ฐœ๋ฐœ ๋ฐ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค๋ฅผ ๋‹จ์ˆœํ™”ํ•˜๊ณ  PROM์—์„œ ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ์ œ์–ดํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

์—ฌ๋Ÿฌ๋ถ„์˜ ๊ธฐ๋Œ€๋ฅผ ์†์ด์ง€ ์•Š๊ธฐ ์œ„ํ•ด ์ด ๊ฒŒ์‹œ๋ฌผ์€ ์†Œ๊ฐœ์šฉ ๊ฒŒ์‹œ๋ฌผ์ด๋ผ๋Š” ์ ์„ ๋ฏธ๋ฆฌ ๋ง์”€๋“œ๋ฆฌ๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ์šฐ์„ , ์›์น™์ ์œผ๋กœ Sber.DS ํ”Œ๋žซํผ์˜ ๋‚ด๋ถ€์— ๋ฌด์—‡์ด ์žˆ๋Š”์ง€์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ์ƒ์„ฑ๋ถ€ํ„ฐ ๊ตฌํ˜„๊นŒ์ง€์˜ ๋ผ์ดํ”„์‚ฌ์ดํด์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ๋ฅผ ๋ณ„๋„๋กœ ์ „ํ•ด๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.

Sber.DS๋Š” ์—ฌ๋Ÿฌ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ, ๊ฐœ๋ฐœ ์‹œ์Šคํ…œ ๋ฐ ๋ชจ๋ธ ์‹คํ–‰ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค.

Sber.DS๋Š” ์ฝ”๋“œ ์—†์ด๋„ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.

๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ๋ชจ๋ธ ๊ฐœ๋ฐœ ์•„์ด๋””์–ด๊ฐ€ ๋‚˜ํƒ€๋‚˜๋Š” ์ˆœ๊ฐ„๋ถ€ํ„ฐ PROM ๊ตฌํ˜„, ๋ชจ๋‹ˆํ„ฐ๋ง ๋ฐ ํ๊ธฐ๊นŒ์ง€ ๋ชจ๋ธ์˜ ์ˆ˜๋ช… ์ฃผ๊ธฐ๋ฅผ ์ œ์–ดํ•ฉ๋‹ˆ๋‹ค. ๋งŽ์€ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๊ธฐ๋Šฅ์€ ๊ต์œก ๋ฐ ๊ฒ€์ฆ ์ƒ˜ํ”Œ์˜ ๋ณด๊ณ  ๋ฐ ์ €์žฅ๊ณผ ๊ฐ™์€ ๊ทœ์ œ ๊ธฐ๊ด€ ๊ทœ์น™์— ๋”ฐ๋ผ ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค. ์‚ฌ์‹ค, ์ด๊ฒƒ์€ ์šฐ๋ฆฌ์˜ ๋ชจ๋“  ๋ชจ๋ธ์˜ ๋“ฑ๋ก์ž…๋‹ˆ๋‹ค.

๊ฐœ๋ฐœ ์‹œ์Šคํ…œ์€ ๋ชจ๋ธ ๋ฐ ๊ฒ€์ฆ ๊ธฐ์ˆ ์˜ ์‹œ๊ฐ์  ๊ฐœ๋ฐœ์„ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ฐœ๋ฐœ๋œ ๋ชจ๋ธ์€ ์ดˆ๊ธฐ ๊ฒ€์ฆ์„ ๊ฑฐ์ณ ์‹คํ–‰ ์‹œ์Šคํ…œ์— ๊ณต๊ธ‰๋˜์–ด ๋น„์ฆˆ๋‹ˆ์Šค ๊ธฐ๋Šฅ์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋Ÿฐํƒ€์ž„ ์‹œ์Šคํ…œ์—์„œ๋Š” ๋ชจ๋ธ์˜ ์ž‘๋™์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ธฐ ์œ„ํ•œ ๊ฒ€์ฆ ๊ธฐ์ˆ ์„ ์ฃผ๊ธฐ์ ์œผ๋กœ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์„ ๋ชจ๋‹ˆํ„ฐ์— ๋ฐฐ์น˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์‹œ์Šคํ…œ์—๋Š” ์—ฌ๋Ÿฌ ์œ ํ˜•์˜ ๋…ธ๋“œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ถ€๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค์— ์—ฐ๊ฒฐํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๊ณ , ๋‹ค๋ฅธ ์ผ๋ถ€๋Š” ์†Œ์Šค ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ™˜ํ•˜๊ณ  ๊ฐ•ํ™”(๋งˆํฌ์—…)ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ๋งŽ์€ ๋…ธ๋“œ์™€ ์ด๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•œ ๋…ธ๋“œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐœ๋ฐœ์ž๋Š” ๋ชจ๋“  ์†Œ์Šค์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๊ณ  ์ค‘๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ™˜, ํ•„ํ„ฐ๋ง, ์‹œ๊ฐํ™”ํ•˜๊ณ  ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ”Œ๋žซํผ์—๋Š” ์„ค๊ณ„ ์˜์—ญ์œผ๋กœ ๋Œ์–ด๋‹ค ๋†“์„ ์ˆ˜ ์žˆ๋Š” ๊ธฐ์„ฑ ๋ชจ๋“ˆ๋„ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ์ž‘์—…์€ ์‹œ๊ฐํ™”๋œ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ํ•œ ์ค„์˜ ์ฝ”๋“œ ์—†์ด๋„ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋‚ด์žฅ๋œ ๊ธฐ๋Šฅ์ด ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ ์‹œ์Šคํ…œ์€ ์ž์‹ ๋งŒ์˜ ๋ชจ๋“ˆ์„ ์‹ ์†ํ•˜๊ฒŒ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋‹ค์Œ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ†ตํ•ฉ ๊ฐœ๋ฐœ ๋ชจ๋“œ๋ฅผ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. Jupyter ์ปค๋„ ๊ฒŒ์ดํŠธ์›จ์ด ์ฒ˜์Œ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด ๋ชจ๋“ˆ์„ ๋งŒ๋“œ๋Š” ์‚ฌ๋žŒ๋“ค์„ ์œ„ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Sber.DS๋Š” ์ฝ”๋“œ ์—†์ด๋„ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.

Sber.DS์˜ ์•„ํ‚คํ…์ฒ˜๋Š” ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค๊ฐ€ ๋ฌด์—‡์ธ์ง€์— ๋Œ€ํ•ด์„œ๋Š” ๋งŽ์€ ์˜๊ฒฌ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์–ด๋–ค ์‚ฌ๋žŒ๋“ค์€ ๋ชจ๋†€๋ฆฌ์‹ ์ฝ”๋“œ๋ฅผ ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋ˆ„๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•˜์ง€๋งŒ ๋™์‹œ์— ์—ฌ์ „ํžˆ ๋™์ผํ•œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋กœ ์ด๋™ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค๋Š” REST API๋ฅผ ํ†ตํ•ด์„œ๋งŒ ๋‹ค๋ฅธ ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค์™€ ํ†ต์‹ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ง์ ‘ ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ๋Š” ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์€ ์—†์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” ์„œ๋น„์Šค๊ฐ€ ๋„ˆ๋ฌด ์ปค์ง€๊ณ  ์„œํˆฌ๋ฅด๊ฒŒ ๋˜์ง€ ์•Š๋„๋ก ๋…ธ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ํ•˜๋‚˜์˜ ์ธ์Šคํ„ด์Šค๋Š” 4~8GB ์ด์ƒ์˜ RAM์„ ์†Œ๋น„ํ•ด์„œ๋Š” ์•ˆ ๋˜๋ฉฐ, ์ƒˆ ์ธ์Šคํ„ด์Šค๋ฅผ ์‹œ์ž‘ํ•˜์—ฌ ์š”์ฒญ์„ ์ˆ˜ํ‰์ ์œผ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์„œ๋น„์Šค๋Š” REST API(๊ณต๊ฐœ API). ์„œ๋น„์Šค๋ฅผ ๋‹ด๋‹นํ•˜๋Š” ํŒ€์€ API๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋งˆ์ง€๋ง‰ ํด๋ผ์ด์–ธํŠธ๊นŒ์ง€ API๋ฅผ ์ด์ „ ๋ฒ„์ „๊ณผ ํ˜ธํ™˜๋˜๋„๋ก ์œ ์ง€ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ํ•ต์‹ฌ์€ Spring Framework๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Java๋กœ ์ž‘์„ฑ๋ฉ๋‹ˆ๋‹ค. ์†”๋ฃจ์…˜์€ ์ฒ˜์Œ์— ํด๋ผ์šฐ๋“œ ์ธํ”„๋ผ์— ์‹ ์†ํ•˜๊ฒŒ ๋ฐฐํฌํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์œผ๋ฏ€๋กœ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์€ ์ปจํ…Œ์ด๋„ˆํ™” ์‹œ์Šคํ…œ์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ตฌ์ถ•๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Red Hat OpenShift (Kubernetes). ํ”Œ๋žซํผ์€ ๋น„์ฆˆ๋‹ˆ์Šค ๊ธฐ๋Šฅ ํ–ฅ์ƒ(์ƒˆ๋กœ์šด ์ปค๋„ฅํ„ฐ, AutoML์ด ์ถ”๊ฐ€๋จ)๊ณผ ๊ธฐ์ˆ  ํšจ์œจ์„ฑ ์ธก๋ฉด์—์„œ ์ง€์†์ ์œผ๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ ํ”Œ๋žซํผ์˜ ๊ธฐ๋Šฅ ์ค‘ ํ•˜๋‚˜๋Š” ๋ชจ๋“  Sberbank ๋ชจ๋ธ ์‹คํ–‰ ์‹œ์Šคํ…œ์—์„œ ์‹œ๊ฐ์  ์ธํ„ฐํŽ˜์ด์Šค๋กœ ๊ฐœ๋ฐœ๋œ ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด์ œ ์ด๋ฏธ ๋‘ ๊ฐœ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜๋‚˜๋Š” Hadoop์—, ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” OpenShift(Docker)์— ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ฑฐ๊ธฐ์„œ ๋ฉˆ์ถ”์ง€ ์•Š๊ณ  ์˜จํ”„๋ ˆ๋ฏธ์Šค์™€ ํด๋ผ์šฐ๋“œ๋ฅผ ํฌํ•จํ•œ ๋ชจ๋“  ์ธํ”„๋ผ์—์„œ ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ํ†ตํ•ฉ ๋ชจ๋“ˆ์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. Sberbank ์ƒํƒœ๊ณ„์— ํšจ๊ณผ์ ์œผ๋กœ ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ด€๋ จํ•˜์—ฌ ๊ธฐ์กด ์‹คํ–‰ ํ™˜๊ฒฝ๊ณผ์˜ ์ž‘์—…๋„ ์ง€์›ํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค. ์•ž์œผ๋กœ ์ด ์†”๋ฃจ์…˜์€ ๋ชจ๋“  ์กฐ์ง์˜ ๋ชจ๋“  ํ™˜๊ฒฝ์— "์ฆ‰์‹œ ์‚ฌ์šฉ ๊ฐ€๋Šฅ"ํ•˜๊ฒŒ ์œ ์—ฐํ•˜๊ฒŒ ํ†ตํ•ฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

PROM์˜ Hadoop์—์„œ Python์„ ์‹คํ–‰ํ•˜๋Š” ์†”๋ฃจ์…˜์„ ์ง€์›ํ•˜๋ ค๊ณ  ์‹œ๋„ํ•œ ์‚ฌ๋žŒ๋“ค์€ ๊ฐ ๋ฐ์ดํ„ฐ ๋…ธ๋“œ์— Python ์‚ฌ์šฉ์ž ํ™˜๊ฒฝ์„ ์ค€๋น„ํ•˜๊ณ  ์ œ๊ณตํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. Python ๋ชจ๋“ˆ์„ ์‚ฌ์šฉํ•˜๋Š” ์ˆ˜๋งŽ์€ ๊ธฐ๊ณ„ ํ•™์Šต์šฉ C/C++ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์—ฌ๋Ÿฌ๋ถ„์„ ํŽธํžˆ ์‰ฌ๊ฒŒ ํ•˜์ง€ ์•Š์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ƒˆ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋‚˜ ์„œ๋ฒ„๋ฅผ ์ถ”๊ฐ€ํ•  ๋•Œ ์ด๋ฏธ ๊ตฌํ˜„๋œ ๋ชจ๋ธ ์ฝ”๋“œ์™€์˜ ํ•˜์œ„ ํ˜ธํ™˜์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ํŒจํ‚ค์ง€๋ฅผ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ๊ธฐ์–ตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์—๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์ ‘๊ทผ ๋ฐฉ์‹์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ๋ฏธ๋ฆฌ ์ค€๋น„ํ•˜์—ฌ PROM์— ๊ตฌํ˜„ํ•ด ๋ณด์„ธ์š”. Cloudera์˜ Hadoop ๋ฐฐํฌํŒ์—์„œ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋‹ค์Œ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊พธ๋Ÿฌ๋ฏธ. ๋˜ํ•œ ์ด์ œ Hadoop์—์„œ๋Š” ๋‹ค์Œ์„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋„์ปค-์ปจํ…Œ์ด๋„ˆ. ์ผ๋ถ€ ๊ฐ„๋‹จํ•œ ๊ฒฝ์šฐ์—๋Š” ํŒจํ‚ค์ง€์™€ ํ•จ๊ป˜ ์ฝ”๋“œ๋ฅผ ์ „๋‹ฌํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. python.eggs.

์€ํ–‰์€ ์ œXNUMX์ž ์ฝ”๋“œ ์‹คํ–‰์˜ ๋ณด์•ˆ์„ ๋งค์šฐ ์ค‘์š”ํ•˜๊ฒŒ ์ƒ๊ฐํ•˜๋ฏ€๋กœ ํ”„๋กœ์„ธ์Šค๊ฐ€ ๊ฒฉ๋ฆฌ๋œ ํ™˜๊ฒฝ์—์„œ ์‹คํ–‰๋˜๋Š” Linux ์ปค๋„์˜ ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ์„ ์ตœ๋Œ€ํ•œ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋ฆฌ๋ˆ…์Šค ๋„ค์ž„์ŠคํŽ˜์ด์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋„คํŠธ์›Œํฌ ๋ฐ ๋กœ์ปฌ ๋””์Šคํฌ์— ๋Œ€ํ•œ ์•ก์„ธ์Šค ๋“ฑ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ์ด๋กœ ์ธํ•ด ์•…์„ฑ ์ฝ”๋“œ์˜ ๊ธฐ๋Šฅ์ด ํฌ๊ฒŒ ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค. ๊ฐ ๋ถ€์„œ์˜ ๋ฐ์ดํ„ฐ ์˜์—ญ์€ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์˜ ์†Œ์œ ์ž๋งŒ ๋ณดํ˜ธํ•˜๊ณ  ์•ก์„ธ์Šคํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”Œ๋žซํผ์€ ์†Œ์Šค์— ๋Œ€ํ•œ ์•ก์„ธ์Šค๋ถ€ํ„ฐ ๋Œ€์ƒ ๋งค์žฅ์— ๋ฐ์ดํ„ฐ๊ฐ€ ๋„์ฐฉํ•˜๋Š” ๊ฒƒ๊นŒ์ง€ ๋ชจ๋“  ๋‹จ๊ณ„์—์„œ ์ œ์–ด๋˜๋Š” ๋ฐ์ดํ„ฐ ๊ฒŒ์‹œ ํ”„๋กœ์„ธ์Šค๋ฅผ ํ†ตํ•ด์„œ๋งŒ ํ•œ ์˜์—ญ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ๋‹ค๋ฅธ ์˜์—ญ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

Sber.DS๋Š” ์ฝ”๋“œ ์—†์ด๋„ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.

์˜ฌํ•ด ์šฐ๋ฆฌ๋Š” Hadoop์—์„œ Python/R/Java๋กœ ์ž‘์„ฑ๋œ ๋ชจ๋ธ ์ถœ์‹œ์˜ MVP๋ฅผ ์™„๋ฃŒํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํ”Œ๋žซํผ ์‚ฌ์šฉ์ž๋ฅผ ์–ด๋–ค ์‹์œผ๋กœ๋“  ์ œํ•œํ•˜์ง€ ์•Š๊ธฐ ์œ„ํ•ด Hadoop์—์„œ ์‚ฌ์šฉ์ž ์ •์˜ ํ™˜๊ฒฝ์„ ์‹คํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์šฐ๋Š” ์•ผ์‹ฌ ์ฐฌ ์ž‘์—…์„ ์Šค์Šค๋กœ ์„ค์ •ํ–ˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ ๋งŽ์€ DS ์ „๋ฌธ๊ฐ€๋Š” ์ˆ˜ํ•™๊ณผ ํ†ต๊ณ„์— ๋›ฐ์–ด๋‚˜๊ณ  ๋ฉ‹์ง„ ๋ชจ๋ธ์„ ๋งŒ๋“ค์ง€๋งŒ ๋น… ๋ฐ์ดํ„ฐ ๋ณ€ํ™˜์— ๋Œ€ํ•ด์„œ๋Š” ์ž˜ ์•Œ์ง€ ๋ชปํ•˜๋ฉฐ ๊ต์œก ์ƒ˜ํ”Œ์„ ์ค€๋น„ํ•˜๋ ค๋ฉด ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด์˜ ๋„์›€์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋™๋ฃŒ๋“ค์„ ๋„์™€ Spark ์—”์ง„ ๋ชจ๋ธ์˜ ํ‘œ์ค€ ๋ณ€ํ™˜ ๋ฐ ๊ธฐ๋Šฅ ์ค€๋น„๋ฅผ ์œ„ํ•œ ํŽธ๋ฆฌํ•œ ๋ชจ๋“ˆ์„ ๋งŒ๋“ค๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด๊ฐ€ ์ƒˆ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ์ค€๋น„ํ•  ๋•Œ๊นŒ์ง€ ๊ธฐ๋‹ค๋ฆฌ์ง€ ์•Š๊ณ  ๋ชจ๋ธ ๊ฐœ๋ฐœ์— ๋” ๋งŽ์€ ์‹œ๊ฐ„์„ ํˆฌ์žํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” Linux ๋ฐ DevOps, Hadoop ๋ฐ Spark, Java ๋ฐ Spring, Scala ๋ฐ Akka, OpenShift ๋ฐ Kubernetes ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ๋Œ€ํ•œ ์ง€์‹์„ ๊ฐ–์ถ˜ ์ธ๋ ฅ์„ ์ฑ„์šฉํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ ์‹œ๊ฐ„์—๋Š” ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ, ๋ชจ๋ธ์ด ํšŒ์‚ฌ ๋‚ด ๋ผ์ดํ”„์‚ฌ์ดํด์„ ํ†ต๊ณผํ•˜๋Š” ๋ฐฉ๋ฒ•, ๊ฒ€์ฆ ๋ฐ ๊ตฌํ˜„ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜ : habr.com

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€