๋ถ„์‚ฐ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํ”Œ๋žซํผ Apache Hadoop 3.3 ์ถœ์‹œ

XNUMX๋…„ ๋ฐ˜์˜ ๊ฐœ๋ฐœ ๋์— ์•„ํŒŒ์น˜ ์†Œํ”„ํŠธ์›จ์–ด ์žฌ๋‹จ ะพะฟัƒะฑะปะธะบะพะฒะฐะปะฐ ์„๋ฐฉํ•˜๋‹ค ์•„ํŒŒ์น˜ ํ•˜๋‘ก 3.3.0, ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์‚ฌ์šฉํ•˜์—ฌ ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์˜ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ๋ฅผ ๊ตฌ์„ฑํ•˜๊ธฐ ์œ„ํ•œ ๋ฌด๋ฃŒ ํ”Œ๋žซํผ ๋งคํ•‘/๊ฐ์†Œ, ์ž‘์—…์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ž‘์€ ๊ฐœ๋ณ„ ์กฐ๊ฐ์œผ๋กœ ๋‚˜๋ˆ„์–ด์ง€๋ฉฐ ๊ฐ ์กฐ๊ฐ์€ ๋ณ„๋„์˜ ํด๋Ÿฌ์Šคํ„ฐ ๋…ธ๋“œ์—์„œ ์‹œ์ž‘๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Hadoop ๊ธฐ๋ฐ˜ ์Šคํ† ๋ฆฌ์ง€๋Š” ์ˆ˜์ฒœ ๊ฐœ์˜ ๋…ธ๋“œ์— ๊ฑธ์ณ ์žˆ์œผ๋ฉฐ ์—‘์‚ฌ๋ฐ”์ดํŠธ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Hadoop์—๋Š” ์ž๋™์œผ๋กœ ๋ฐ์ดํ„ฐ ๋ฐฑ์—…์„ ์ œ๊ณตํ•˜๊ณ  MapReduce ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ์ตœ์ ํ™”๋œ HDFS(Hadoop ๋ถ„์‚ฐ ํŒŒ์ผ ์‹œ์Šคํ…œ) ๊ตฌํ˜„์ด ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. Hadoop ์Šคํ† ๋ฆฌ์ง€์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์•ก์„ธ์Šค๋ฅผ ๋‹จ์ˆœํ™”ํ•˜๊ธฐ ์œ„ํ•ด HBase ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ SQL ์œ ์‚ฌ ์–ธ์–ด Pig๊ฐ€ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” MapReduce์šฉ SQL์˜ ์ผ์ข…์œผ๋กœ ์—ฌ๋Ÿฌ Hadoop ํ”Œ๋žซํผ์—์„œ ์ฟผ๋ฆฌ๋ฅผ ๋ณ‘๋ ฌํ™”ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋กœ์ ํŠธ๋Š” ์™„์ „ํžˆ ์•ˆ์ •์ ์ด๊ณ  ์‚ฐ์—… ์šด์˜ ์ค€๋น„๊ฐ€ ์™„๋ฃŒ๋œ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. Hadoop์€ ๋Œ€๊ทœ๋ชจ ์‚ฐ์—… ํ”„๋กœ์ ํŠธ์— ์ ๊ทน์ ์œผ๋กœ ์‚ฌ์šฉ๋˜์–ด Google Bigtable/GFS/MapReduce ํ”Œ๋žซํผ๊ณผ ์œ ์‚ฌํ•œ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Google์€ ๊ณต์‹์ ์œผ๋กœ ์œ„์ž„๋จ Hadoop ๋ฐ ๊ธฐํƒ€ Apache ํ”„๋กœ์ ํŠธ๋Š” MapReduce ๋ฐฉ๋ฒ•๊ณผ ๊ด€๋ จ๋œ ํŠนํ—ˆ๊ฐ€ ์ ์šฉ๋˜๋Š” ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•  ๊ถŒ๋ฆฌ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

Hadoop์€ ๋ณ€๊ฒฝ ํšŸ์ˆ˜ ์ธก๋ฉด์—์„œ Apache ๋ฆฌํฌ์ง€ํ† ๋ฆฌ ์ค‘ 4์œ„๋ฅผ ์ฐจ์ง€ํ–ˆ์œผ๋ฉฐ ์ฝ”๋“œ๋ฒ ์ด์Šค ํฌ๊ธฐ(์•ฝ 500๋งŒ ์ค„์˜ ์ฝ”๋“œ) ์ธก๋ฉด์—์„œ 10์œ„๋ฅผ ์ฐจ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” Hadoop ๊ตฌํ˜„์œผ๋กœ๋Š” Netflix(๋งค์ผ 5์–ต ๊ฐœ ์ด์ƒ์˜ ์ด๋ฒคํŠธ ์ €์žฅ), Twitter(4๊ฐœ ๋…ธ๋“œ๋กœ ๊ตฌ์„ฑ๋œ ํด๋Ÿฌ์Šคํ„ฐ๊ฐ€ 300์ œํƒ€๋ฐ”์ดํŠธ ์ด์ƒ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ €์žฅํ•˜๊ณ  ํ•˜๋ฃจ 4์–ต ๊ฐœ ์ด์ƒ์˜ ์„ธ์…˜ ์ฒ˜๋ฆฌ), Facebook(ํด๋Ÿฌ์Šคํ„ฐ) ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. XNUMX๊ฐœ์˜ ๋…ธ๋“œ ์ค‘ XNUMXํŽ˜ํƒ€๋ฐ”์ดํŠธ ์ด์ƒ์„ ์ €์žฅํ•˜๊ณ  ๋งค์ผ XNUMXPB์”ฉ ์ฆ๊ฐ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฃผ์š” ๋ณ€๊ฒฝ Apache Hadoop 3.3์—์„œ:

  • ARM ์•„ํ‚คํ…์ฒ˜ ๊ธฐ๋ฐ˜ ํ”Œ๋žซํผ์— ๋Œ€ํ•œ ์ง€์›์ด ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ํ˜•์‹์˜ ๊ตฌํ˜„ ํ”„๋กœํ† ๋ถ€ํ”„ ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ง๋ ฌํ™”ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” (ํ”„๋กœํ† ์ฝœ ๋ฒ„ํผ)๋Š” protobuf-3.7.1 ๋ถ„๊ธฐ์˜ ์ˆ˜๋ช… ์ฃผ๊ธฐ ์ข…๋ฃŒ๋กœ ์ธํ•ด ๋ฆด๋ฆฌ์Šค 2.5.0๋กœ ์—…๋ฐ์ดํŠธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • S3A ์ปค๋„ฅํ„ฐ์˜ ๊ธฐ๋Šฅ์ด ํ™•์žฅ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ† ํฐ์„ ์‚ฌ์šฉํ•œ ์ธ์ฆ ์ง€์›์ด ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค(์œ„์ž„ ํ† ํฐ), ์ฝ”๋“œ 404๋ฅผ ํ†ตํ•œ ์บ์‹ฑ ์‘๋‹ต ์ง€์› ๊ฐœ์„ , S3guard ์„ฑ๋Šฅ ํ–ฅ์ƒ ๋ฐ ์šด์˜ ์•ˆ์ •์„ฑ ํ–ฅ์ƒ.
  • ABFS ํŒŒ์ผ ์‹œ์Šคํ…œ์—์„œ ์ž๋™ ์กฐ์ • ๋ฌธ์ œ๊ฐ€ ํ•ด๊ฒฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • COS ๊ฐ์ฒด ์Šคํ† ๋ฆฌ์ง€์— ์•ก์„ธ์Šคํ•˜๊ธฐ ์œ„ํ•ด Tencent Cloud COS ํŒŒ์ผ ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ์ง€์›์ด ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • Java 11์— ๋Œ€ํ•œ ์ „์ฒด ์ง€์›์ด ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • HDFS RBF(Router-based Federation) ๊ตฌํ˜„์ด ์•ˆ์ •ํ™”๋˜์—ˆ์Šต๋‹ˆ๋‹ค. HDFS ๋ผ์šฐํ„ฐ์— ๋ณด์•ˆ ์ œ์–ด๊ฐ€ ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ํด๋ผ์ด์–ธํŠธ๊ฐ€ ํ˜ธ์ŠคํŠธ ์ด๋ฆ„๋ณ„๋กœ DNS๋ฅผ ํ†ตํ•ด ์„œ๋ฒ„๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋„๋ก DNS ํ™•์ธ ์„œ๋น„์Šค๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์„ค์ •์— ๋ชจ๋“  ํ˜ธ์ŠคํŠธ๋ฅผ ๋‚˜์—ดํ•˜์ง€ ์•Š๊ณ ๋„ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ถœ์‹œ ์ผ์ • ์ง€์› ์ถ”๊ฐ€ ๊ธฐํšŒ์ฃผ์˜์  ์ปจํ…Œ์ด๋„ˆ ๊ฐ ๋…ธ๋“œ์˜ ๋กœ๋“œ๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ์ปจํ…Œ์ด๋„ˆ๋ฅผ ๋ฐฐํฌํ•˜๋Š” ๊ธฐ๋Šฅ์„ ํฌํ•จํ•˜์—ฌ ์ค‘์•™ ์ง‘์ค‘์‹ ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ์ž(ResourceManager)๋ฅผ ํ†ตํ•ด.
  • ๊ฒ€์ƒ‰ ๊ฐ€๋Šฅํ•œ YARN(Yet Another Resource Negotiator) ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋””๋ ‰ํ„ฐ๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜ : opennet.ru

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€