เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ
เชฐเซ€เชฎเชพเชฐเชฟเชจ เชฆเซเชตเชพเชฐเชพ เชนเชตเชพเชฎเชพเชจ เชฆเซ‡เชตเชคเชพ

เชŸเซ€เชฎ Mail.ru เช•เซเชฒเชพเช‰เชก เชธเซ‹เชฒเซเชฏเซเชถเชจเซเชธ เชคเช• เช†เชชเซ‡ เช›เซ‡ เชฒเซ‡เช– เช…เชจเซเชตเชพเชฆ เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เช•เชฏเชพ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ เช›เซ‡, เชนเชกเซเชช เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ€ เชธเซŒเชฅเซ€ เชธเชพเชฎเชพเชจเซเชฏ เชธเซเชตเชฟเชงเชพเช“ เชถเซเช‚ เช›เซ‡ เช…เชจเซ‡ เช•เชฏเชพ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ‹ เช‰เชชเชฏเซ‹เช— เช•เชฐเชตเซ‹ เชตเชงเซ เชธเชพเชฐเซเช‚ เช›เซ‡ เชคเซ‡ เชตเชฟเชถเซ‡ เช•เซเชฒเซ‡เชฐเชตเซ‹เชฏเชจเซเชŸเชจเชพ เชเชจเซเชœเชฟเชจเชฟเชฏเชฐ เชฐเชพเชนเซเชฒ เชญเชพเชŸเชฟเชฏเชพ.

เชถเชพ เชฎเชพเชŸเซ‡ เชตเชฟเชตเชฟเชง เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ€ เชœเชฐเซ‚เชฐ เช›เซ‡?

HDFS-เชธเช•เซเชทเชฎ เชเชชเซเชฒเซ€เช•เซ‡เชถเชจเซ‹ เชœเซ‡เชฎ เช•เซ‡ MapReduce เช…เชจเซ‡ Spark เชฎเชพเชŸเซ‡ เชเช• เชฎเซเช–เซเชฏ เชชเซเชฐเชฆเชฐเซเชถเชจ เช…เชตเชฐเซ‹เชง เช เชกเซ‡เชŸเชพ เชถเซ‹เชงเชตเชพ, เชตเชพเช‚เชšเชตเชพ เช…เชจเซ‡ เชฒเช–เชตเชพเชฎเชพเช‚ เชœเซ‡ เชธเชฎเชฏ เชฒเซ‡ เช›เซ‡ เชคเซ‡ เช›เซ‡. เช† เชธเชฎเชธเซเชฏเชพเช“ เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพ เชธเซ‡เชŸเซเชธเชจเซเช‚ เชธเช‚เชšเชพเชฒเชจ เช•เชฐเชตเชพเชฎเชพเช‚ เชฎเซเชถเซเช•เซ‡เชฒเซ€เชจเซ‡ เช•เชพเชฐเชฃเซ‡ เชฅเชพเชฏ เช›เซ‡ เชœเซ‹ เช…เชฎเชพเชฐเซ€ เชชเชพเชธเซ‡ เชจเชฟเชถเซเชšเชฟเชค เชธเซเช•เซ€เชฎเชพเชจเซ‡ เชฌเชฆเชฒเซ‡ เชตเชฟเช•เชธเชคเซ€ เชธเซเช•เซ€เชฎเชพ เชนเซ‹เชฏ, เช…เชฅเชตเชพ เชœเซ‹ เชคเซเชฏเชพเช‚ เช•เซ‡เชŸเชฒเชพเช• เชธเซเชŸเซ‹เชฐเซ‡เชœ เช…เชตเชฐเซ‹เชงเซ‹ เชนเซ‹เชฏ.

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพ เชชเชฐ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพ เช•เชฐเชตเชพเชฅเซ€ เชธเซเชŸเซ‹เชฐเซ‡เชœ เชธเชฌเชธเชฟเชธเซเชŸเชฎ เชชเชฐเชจเซ‹ เชญเชพเชฐ เชตเชงเซ‡ เช›เซ‡ - Hadoop เชซเซ‹เชฒเซเชŸ เชŸเซ‹เชฒเชฐเชจเซเชธ เชนเชพเช‚เชธเชฒ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เช…เชจเชพเชตเชถเซเชฏเช• เชฐเซ€เชคเซ‡ เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐ เช•เชฐเซ‡ เช›เซ‡. เชกเชฟเชธเซเช• เช‰เชชเชฐเชพเช‚เชค, เชชเซเชฐเซ‹เชธเซ‡เชธเชฐ, เชจเซ‡เชŸเชตเชฐเซเช•, เช‡เชจเชชเซเชŸ/เช†เช‰เชŸเชชเซเชŸ เชธเชฟเชธเซเชŸเชฎ, เชตเช—เซ‡เชฐเซ‡ เชฒเซ‹เชก เชฅเชพเชฏ เช›เซ‡. เชœเซ‡เชฎ เชœเซ‡เชฎ เชกเซ‡เชŸเชพเชจเซเช‚ เชชเซเชฐเชฎเชพเชฃ เชตเชงเชคเซเช‚ เชœเชพเชฏ เช›เซ‡ เชคเซ‡เชฎ เชคเซ‡เชฎ เชคเซ‡เชจเซ€ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพ เช…เชจเซ‡ เชธเช‚เช—เซเชฐเชนเชจเซ‹ เช–เชฐเซเชš เชชเชฃ เชตเชงเซ‡ เช›เซ‡.

เชฎเชพเช‚ เชตเชฟเชตเชฟเชง เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ Hadoop เช† เชธเชฎเชธเซเชฏเชพเช“เชจเซ‹ เชšเซ‹เช•เซเช•เชธ เช‰เช•เซ‡เชฒ เชฒเชพเชตเชตเชพ เชฎเชพเชŸเซ‡ เชถเซ‹เชง เช•เชฐเซ€. เชฏเซ‹เช—เซเชฏ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชชเชธเช‚เชฆ เช•เชฐเชตเชพเชฅเซ€ เช•เซ‡เชŸเชฒเชพเช• เชจเซ‹เช‚เชงเชชเชพเชคเซเชฐ เชฒเชพเชญเซ‹ เชฎเชณเซ€ เชถเช•เซ‡ เช›เซ‡:

  1. เชเชกเชชเซ€ เชตเชพเช‚เชšเชจ เชธเชฎเชฏ.
  2. เชเชกเชชเซ€ เชฐเซ‡เช•เซ‹เชฐเซเชกเชฟเช‚เช— เชธเชฎเชฏ.
  3. เชถเซ‡เชฐ เช•เชฐเซ‡เชฒเซ€ เชซเชพเช‡เชฒเซ‹.
  4. เชธเซเช•เซ€เชฎเชพ เช‰เชคเซเช•เซเชฐเชพเช‚เชคเชฟ เชฎเชพเชŸเซ‡ เช†เชงเชพเชฐ.
  5. เชตเชฟเชธเซเชคเซƒเชค เช•เชฎเซเชชเซเชฐเซ‡เชถเชจ เชธเชชเซ‹เชฐเซเชŸ.

เช•เซ‡เชŸเชฒเชพเช• เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชธเชพเชฎเชพเชจเซเชฏ เช‰เชชเชฏเซ‹เช— เชฎเชพเชŸเซ‡ เชฌเชจเชพเชตเชพเชฏเซ‡เชฒ เช›เซ‡, เช…เชจเซเชฏ เชตเชงเซ เชšเซ‹เช•เซเช•เชธ เช‰เชชเชฏเซ‹เช— เชฎเชพเชŸเซ‡, เช…เชจเซ‡ เช•เซ‡เชŸเชฒเชพเช• เชšเซ‹เช•เซเช•เชธ เชกเซ‡เชŸเชพ เชฒเชพเช•เซเชทเชฃเชฟเช•เชคเชพเช“เชจเซ‡ เชชเชนเซ‹เช‚เชšเซ€ เชตเชณเชตเชพ เชฎเชพเชŸเซ‡ เชฐเชšเชพเชฏเซ‡เชฒ เช›เซ‡. เชคเซ‡เชฅเซ€ เชชเชธเช‚เชฆเช—เซ€ เช–เชฐเซ‡เช–เชฐ เช–เซ‚เชฌ เชฎเซ‹เชŸเซ€ เช›เซ‡.

เชเชตเชฐเซ‹ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ

เชฎเชพเชŸเซ‡ เชกเซ‡เชŸเชพ เชธเซ€เชฐเซ€เชฏเชฒเชพเช‡เชเซ‡เชถเชจ เชเชตเชฐเซ‹ เชตเซเชฏเชพเชชเช•เชชเชฃเซ‡ เช‰เชชเชฏเซ‹เช—เชฎเชพเช‚ เชฒเซ‡เชตเชพเชฏ เช›เซ‡ - เชคเซ‡ เชถเชฌเซเชฆเชฎเชพเชณเชพ เช†เชงเชพเชฐเชฟเชค, เชเชŸเชฒเซ‡ เช•เซ‡, Hadoop เชฎเชพเช‚ เชธเซเชŸเซเชฐเชฟเช‚เช— เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐเซ‡เชœ เชซเซ‹เชฐเซเชฎเซ‡เชŸ. เชคเซ‡ เชธเซเช•เซ€เชฎเชพเชจเซ‡ JSON เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเซ‡ เช›เซ‡, เชœเซ‡ เช•เซ‹เชˆเชชเชฃ เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ เชฆเซเชตเชพเชฐเชพ เชตเชพเช‚เชšเชตเชพ เช…เชจเซ‡ เช…เชฐเซเชฅเช˜เชŸเชจ เช•เชฐเชตเชพเชจเซเช‚ เชธเชฐเชณ เชฌเชจเชพเชตเซ‡ เช›เซ‡. เชกเซ‡เชŸเชพ เชชเซ‹เชคเซ‡ เชฌเชพเชˆเชจเชฐเซ€ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เช›เซ‡, เช•เซ‹เชฎเซเชชเซ‡เช•เซเชŸ เช…เชจเซ‡ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เช›เซ‡.

เชเชตเชฐเซ‹เชจเซ€ เชธเซ€เชฐเซ€เชฏเชฒเชพเช‡เชเซ‡เชถเชจ เชธเชฟเชธเซเชŸเชฎ เชญเชพเชทเชพ เชคเชŸเชธเซเชฅ เช›เซ‡. เชซเชพเช‡เชฒเซ‹ เชตเชฟเชตเชฟเชง เชญเชพเชทเชพเช“เชฎเชพเช‚ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพ เช•เชฐเซ€ เชถเช•เชพเชฏ เช›เซ‡, เชนเชพเชฒเชฎเชพเช‚ C, C++, C#, Java, Python เช…เชจเซ‡ Ruby.

เชเชตเชฐเซ‹เชจเซ€ เชฎเซเช–เซเชฏ เชตเชฟเชถเซ‡เชทเชคเชพ เช เชกเซ‡เชŸเชพ เชธเซเช•เซ€เชฎเชพ เชฎเชพเชŸเซ‡ เชคเซ‡เชจเซ‹ เชฎเชœเชฌเซ‚เชค เช†เชงเชพเชฐ เช›เซ‡ เชœเซ‡ เชธเชฎเชฏ เชœเชคเชพเช‚ เชฌเชฆเชฒเชพเชฏ เช›เซ‡, เชเชŸเชฒเซ‡ เช•เซ‡ เชตเชฟเช•เชพเชธ เชฅเชพเชฏ เช›เซ‡. เชเชตเชฐเซ‹ เชธเซเช•เซ€เชฎเชพ เชซเซ‡เชฐเชซเชพเชฐเซ‹เชจเซ‡ เชธเชฎเชœเซ‡ เช›เซ‡ - เชซเชฟเชฒเซเชกเชจเซ‡ เช•เชพเชขเซ€ เชจเชพเช–เชตเซเช‚, เช‰เชฎเซ‡เชฐเชตเซเช‚ เช…เชฅเชตเชพ เชฌเชฆเชฒเชตเซเช‚.

เชเชตเชฐเซ‹ เชตเชฟเชตเชฟเชง เชกเซ‡เชŸเชพ เชธเซเชŸเซเชฐเช•เซเชšเชฐเซเชธเชจเซ‡ เชธเชชเซ‹เชฐเซเชŸ เช•เชฐเซ‡ เช›เซ‡. เช‰เชฆเชพเชนเชฐเชฃ เชคเชฐเซ€เช•เซ‡, เชคเชฎเซ‡ เชเช• เชเชตเซ‹ เชฐเซ‡เช•เซ‹เชฐเซเชก เชฌเชจเชพเชตเซ€ เชถเช•เซ‹ เช›เซ‹ เชœเซ‡เชฎเชพเช‚ เชเชฐเซ‡, เชเช• เช—เชฃเชฟเชค เชชเซเชฐเช•เชพเชฐ เช…เชจเซ‡ เชธเชฌเชฐเซ‡เช•เซ‹เชฐเซเชก เชนเซ‹เชฏ.

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ
เช† เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชกเซ‡เชŸเชพ เชฒเซ‡เช• (เชกเซ‡เชŸเชพ เชคเชณเชพเชต, เช…เชฅเชตเชพ เชกเซ‡เชŸเชพ เชฒเซ‡เช• - เชธเซ€เชงเชพ เชกเซ‡เชŸเชพ เชธเซเชคเซเชฐเซ‹เชคเซ‹ เช‰เชชเชฐเชพเช‚เชค เชตเชฟเชตเชฟเชง เชชเซเชฐเช•เชพเชฐเชจเชพ เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡เชจเชพ เช‰เชฆเชพเชนเชฐเชฃเซ‹เชจเซ‹ เชธเช‚เช—เซเชฐเชน).

เชคเซ‡เชฅเซ€, เชจเซ€เชšเซ‡เชจเชพ เช•เชพเชฐเชฃเซ‹เชธเชฐ เชกเซ‡เชŸเชพ เชฒเซ‡เช•เชจเชพ เชฒเซ‡เชจเซเชกเชฟเช‚เช— เชเซ‹เชจ เชชเชฐ เชฒเช–เชตเชพ เชฎเชพเชŸเซ‡ เช† เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชธเซŒเชฅเซ€ เชฏเซ‹เช—เซเชฏ เช›เซ‡:

  1. เช† เชเซ‹เชจเชฎเชพเช‚เชฅเซ€ เชกเซ‡เชŸเชพ เชธเชพเชฎเชพเชจเซเชฏ เชฐเซ€เชคเซ‡ เชกเชพเช‰เชจเชธเซเชŸเซเชฐเซ€เชฎ เชธเชฟเชธเซเชŸเชฎเซเชธ เชฆเซเชตเชพเชฐเชพ เช†เช—เชณเชจเซ€ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพ เชฎเชพเชŸเซ‡ เชธเช‚เชชเซ‚เชฐเซเชฃ เชฐเซ€เชคเซ‡ เชตเชพเช‚เชšเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡ - เช…เชจเซ‡ เช† เช•เชฟเชธเซเชธเชพเชฎเชพเช‚ เชชเช‚เช•เซเชคเชฟ-เช†เชงเชพเชฐเชฟเชค เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชตเชงเซ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เช›เซ‡.
  2. เชกเชพเช‰เชจเชธเซเชŸเซเชฐเซ€เชฎ เชธเชฟเชธเซเชŸเชฎเซเชธ เชธเชฐเชณเชคเชพเชฅเซ€ เชซเชพเช‡เชฒเซ‹เชฎเชพเช‚เชฅเซ€ เชธเซเช•เซ€เชฎเชพ เช•เซ‹เชทเซเชŸเช•เซ‹ เชชเซเชจเชƒเชชเซเชฐเชพเชชเซเชค เช•เชฐเซ€ เชถเช•เซ‡ เช›เซ‡ - เชฌเชพเชนเซเชฏ เชฎเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐเซ‡เชœเชฎเชพเช‚ เชธเซเช•เซ€เชฎเชพเชจเซ‡ เช…เชฒเช—เชฅเซ€ เชธเซเชŸเซ‹เชฐ เช•เชฐเชตเชพเชจเซ€ เชœเชฐเซ‚เชฐ เชจเชฅเซ€.
  3. เชฎเซ‚เชณ เชฏเซ‹เชœเชจเชพเชฎเชพเช‚ เช•เซ‹เชˆเชชเชฃ เชซเซ‡เชฐเชซเชพเชฐ เชธเชฐเชณเชคเชพเชฅเซ€ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพ เช•เชฐเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡ (เชธเซเช•เซ€เชฎเชพ เช‰เชคเซเช•เซเชฐเชพเช‚เชคเชฟ).

เชฒเชพเช•เชกเชพเชจเซเช‚ เชชเชพเชคเชณเซเช‚ เชชเชก เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ

Parquet Hadoop เชฎเชพเชŸเซ‡ เช“เชชเชจ เชธเซ‹เชฐเซเชธ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เช›เซ‡ เชœเซ‡ เชธเซเชŸเซ‹เชฐ เช•เชฐเซ‡ เช›เซ‡ เชซเซเชฒเซ‡เชŸ เช•เซ‹เชฒเชฎเชฐ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เชจเซ‡เชธเซเชŸเซ‡เชก เชกเซ‡เชŸเชพ เชธเซเชŸเซเชฐเช•เซเชšเชฐเซเชธ.

เชชเชฐเช‚เชชเชฐเชพเช—เชค เชชเช‚เช•เซเชคเชฟ เช…เชญเชฟเช—เชฎเชจเซ€ เชคเซเชฒเชจเชพเชฎเชพเช‚, เชธเช‚เช—เซเชฐเชน เช…เชจเซ‡ เช•เชพเชฎเช—เซ€เชฐเซ€เชจเซ€ เชฆเซเชฐเชทเซเชŸเชฟเช Parquet เชตเชงเซ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เช›เซ‡.

เช† เช–เชพเชธ เช•เชฐเซ€เชจเซ‡ เช•เซเชตเซ‡เชฐเซ€ เชฎเชพเชŸเซ‡ เช‰เชชเชฏเซ‹เช—เซ€ เช›เซ‡ เชœเซ‡ เชตเชฟเชถเชพเชณ (เช˜เชฃเชพ เช•เซ‰เชฒเชฎ) เช•เซ‹เชทเซเชŸเช•เชฎเชพเช‚เชฅเซ€ เชšเซ‹เช•เซเช•เชธ เช•เซ‰เชฒเชฎ เชตเชพเช‚เชšเซ‡ เช›เซ‡. เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชฎเชพเชŸเซ‡ เช†เชญเชพเชฐ, เชซเช•เซเชค เชœเชฐเซ‚เชฐเซ€ เช•เซ‰เชฒเชฎ เชœ เชตเชพเช‚เชšเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡, เชคเซ‡เชฅเซ€ I/O เชจเซ‡ เชจเซเชฏเซ‚เชจเชคเชฎ เชฐเชพเช–เชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡.

เชเช• เชจเชพเชจเซ‹ เชตเชฟเชทเชฏเชพเช‚เชคเชฐ เช…เชจเซ‡ เชธเชฎเชœเซ‚เชคเซ€: Hadoop เชฎเชพเช‚ Parquet เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ‡ เชตเชงเซ เชธเชพเชฐเซ€ เชฐเซ€เชคเซ‡ เชธเชฎเชœเชตเชพ เชฎเชพเชŸเซ‡, เชšเชพเชฒเซ‹ เชœเซ‹เชˆเช เช•เซ‡ เช•เซ‰เชฒเชฎ-เช†เชงเชพเชฐเชฟเชค - เชเชŸเชฒเซ‡ เช•เซ‡ เช•เซ‰เชฒเชฎเชฐ - เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชถเซเช‚ เช›เซ‡. เช† เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎ เชฎเชพเชŸเซ‡ เชธเชฎเชพเชจ เชฎเซ‚เชฒเซเชฏเซ‹เชจเซ‡ เชเช•เชธเชพเชฅเซ‡ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเซ‡ เช›เซ‡.

เช‰เชฆเชพเชนเชฐเชฃ เชคเชฐเซ€เช•เซ‡, เชฐเซ‡เช•เซ‹เชฐเซเชกเชฎเชพเช‚ ID, เชจเชพเชฎ เช…เชจเซ‡ เชตเชฟเชญเชพเช— เชซเซ€เชฒเซเชกเชจเซ‹ เชธเชฎเชพเชตเซ‡เชถ เชฅเชพเชฏ เช›เซ‡. เช† เช•เชฟเชธเซเชธเชพเชฎเชพเช‚, เชฌเชงเชพ ID เช•เซ‰เชฒเชฎ เชฎเซ‚เชฒเซเชฏเซ‹ เชเช•เชธเชพเชฅเซ‡ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเชตเชพเชฎเชพเช‚ เช†เชตเชถเซ‡, เชœเซ‡เชฎ เช•เซ‡ เชจเชพเชฎ เช•เซ‰เชฒเชฎ เชฎเซ‚เชฒเซเชฏเซ‹, เชตเช—เซ‡เชฐเซ‡. เชŸเซ‡เชฌเชฒ เช†เชจเชพ เชœเซ‡เชตเซเช‚ เช•เช‚เชˆเช• เชฆเซ‡เช–เชพเชถเซ‡:

ID
เชจเชพเชฎ
เชตเชฟเชญเชพเช—

1
emp1
d1

2
emp2
d2

3
emp3
d3

เชธเซเชŸเซเชฐเชฟเช‚เช— เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚, เชกเซ‡เชŸเชพ เชจเซ€เชšเซ‡ เชชเซเชฐเชฎเชพเชฃเซ‡ เชธเชพเชšเชตเชตเชพเชฎเชพเช‚ เช†เชตเชถเซ‡:

1
emp1
d1
2
emp2
d2
3
emp3
d3

เช•เซ‰เชฒเชฎเชฐ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚, เชธเชฎเชพเชจ เชกเซ‡เชŸเชพ เช† เชฐเซ€เชคเซ‡ เชธเชพเชšเชตเชตเชพเชฎเชพเช‚ เช†เชตเชถเซ‡:

1
2
3
emp1
emp2
emp3
d1
d2
d3

เชœเซเชฏเชพเชฐเซ‡ เชคเชฎเชพเชฐเซ‡ เช•เซ‹เชทเซเชŸเช•เชฎเชพเช‚เชฅเซ€ เชฌเชนเซเชตเชฟเชง เช•เซ‰เชฒเชฎเซเชธเชจเซ€ เช•เซเชตเซ‡เชฐเซ€ เช•เชฐเชตเชพเชจเซ€ เชœเชฐเซ‚เชฐ เชนเซ‹เชฏ เชคเซเชฏเชพเชฐเซ‡ เช•เซ‰เชฒเชฎเชฐ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชตเชงเซ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เชนเซ‹เชฏ เช›เซ‡. เชคเซ‡ เชฎเชพเชคเซเชฐ เชœเชฐเซ‚เชฐเซ€ เช•เซ‰เชฒเชฎ เชตเชพเช‚เชšเชถเซ‡ เช•เชพเชฐเชฃ เช•เซ‡ เชคเซ‡ เช…เชกเซ€เชจเซ‡ เช›เซ‡. เช† เชฐเซ€เชคเซ‡, I/O เช•เชพเชฎเช—เซ€เชฐเซ€เชจเซ‡ เชจเซเชฏเซ‚เชจเชคเชฎ เชฐเชพเช–เชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡.

เช‰เชฆเชพเชนเชฐเชฃ เชคเชฐเซ€เช•เซ‡, เชคเชฎเชพเชฐเซ‡ เชซเช•เซเชค NAME เช•เซ‰เชฒเชฎเชจเซ€ เชœเชฐเซ‚เชฐ เช›เซ‡. IN เชธเซเชŸเซเชฐเชฟเช‚เช— เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชกเซ‡เชŸเชพเชธเซ‡เชŸเชฎเชพเช‚เชจเชพ เชฆเชฐเซ‡เช• เชฐเซ‡เช•เซ‹เชฐเซเชกเชจเซ‡ เชฒเซ‹เชก เช•เชฐเชตเชพเชจเซ€, เชซเซ€เชฒเซเชก เชฆเซเชตเชพเชฐเชพ เชตเชฟเชถเซเชฒเซ‡เชทเชฟเชค เช•เชฐเชตเชพเชจเซ€ เช…เชจเซ‡ เชชเช›เซ€ NAME เชกเซ‡เชŸเชพ เช•เชพเชขเชตเชพเชจเซ€ เชœเชฐเซ‚เชฐ เช›เซ‡. เช•เซ‰เชฒเชฎ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชคเชฎเชจเซ‡ เชธเซ€เชงเชพ เชœ เชจเชพเชฎ เช•เซ‰เชฒเชฎเชฎเชพเช‚ เชกเซเชฐเชฟเชฒ เชกเชพเช‰เชจ เช•เชฐเชตเชพเชจเซ€ เชฎเช‚เชœเซ‚เชฐเซ€ เช†เชชเซ‡ เช›เซ‡ เช•เชพเชฐเชฃ เช•เซ‡ เชคเซ‡ เช•เซ‰เชฒเชฎ เชฎเชพเชŸเซ‡เชจเชพ เชคเชฎเชพเชฎ เชฎเซ‚เชฒเซเชฏเซ‹ เชเช•เชธเชพเชฅเซ‡ เชธเช‚เช—เซเชฐเชนเชฟเชค เช›เซ‡. เชคเชฎเชพเชฐเซ‡ เชธเชฎเช—เซเชฐ เชฐเซ‡เช•เซ‹เชฐเซเชกเชฟเช‚เช— เชธเซเช•เซ‡เชจ เช•เชฐเชตเชพเชจเซ€ เชœเชฐเซ‚เชฐ เชจเชฅเซ€.

เช†เชฎ, เช•เซ‰เชฒเชฎเชฐ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เช•เซเชตเซ‡เชฐเซ€ เช•เชพเชฎเช—เซ€เชฐเซ€เชจเซ‡ เชธเซเชงเชพเชฐเซ‡ เช›เซ‡ เช•เชพเชฐเชฃ เช•เซ‡ เชคเซ‡เชจเซ‡ เชœเชฐเซ‚เชฐเซ€ เช•เซ‰เชฒเชฎเซเชธ เชธเซเชงเซ€ เชชเชนเซ‹เช‚เชšเชตเชพ เชฎเชพเชŸเซ‡ เช“เช›เชพ เชฒเซเช•เช…เชช เชธเชฎเชฏเชจเซ€ เชœเชฐเซ‚เชฐ เชชเชกเซ‡ เช›เซ‡ เช…เชจเซ‡ I/O เช‘เชชเชฐเซ‡เชถเชจเชจเซ€ เชธเช‚เช–เซเชฏเชพ เช˜เชŸเชพเชกเซ‡ เช›เซ‡ เช•เชพเชฐเชฃ เช•เซ‡ เชฎเชพเชคเซเชฐ เช‡เชšเซเช›เชฟเชค เช•เซ‰เชฒเชฎ เชœ เชตเชพเช‚เชšเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡.

เช…เชจเชจเซเชฏ เชฒเช•เซเชทเชฃเซ‹ เชชเซˆเช•เซ€ เชเช• เชฆเซ‹เชฐเซ€ เช† เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เชคเซ‡ เช•เชฐเซ€ เชถเช•เซ‡ เช›เซ‡ เชจเซ‡เชธเซเชŸเซ‡เชก เชธเซเชŸเซเชฐเช•เซเชšเชฐเซเชธ เชธเชพเชฅเซ‡ เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐ เช•เชฐเซ‹. เช†เชจเซ‹ เช…เชฐเซเชฅ เช เช›เซ‡ เช•เซ‡ Parquet เชซเชพเช‡เชฒเชฎเชพเช‚, เชจเซ‡เชธเซเชŸเซ‡เชก เชธเซเชŸเซเชฐเช•เซเชšเชฐเชฎเชพเช‚เชจเชพ เชคเชฎเชพเชฎ เชซเซ€เชฒเซเชกเซเชธเชจเซ‡ เชตเชพเช‚เชšเซเชฏเชพ เชตเชฟเชจเชพ เชชเชฃ เชจเซ‡เชธเซเชŸเซ‡เชก เชซเซ€เชฒเซเชกเซเชธ เชตเซเชฏเช•เซเชคเชฟเช—เชค เชฐเซ€เชคเซ‡ เชตเชพเช‚เชšเซ€ เชถเช•เชพเชฏ เช›เซ‡. เชจเซ‡เชธเซเชŸเซ‡เชก เชธเซเชŸเซเชฐเช•เซเชšเชฐเซเชธเชจเซ‡ เชธเซเชŸเซ‹เชฐ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เชฒเชพเช•เชกเชพเชจเซเช‚ เชชเชพเชคเชณเซเช‚ เชชเชก เช•เชพเชชเชฃเซ€ เช…เชจเซ‡ เชเชธเซ‡เชฎเซเชฌเชฒเซ€ เช…เชฒเซเช—เซ‹เชฐเชฟเชงเชฎเชจเซ‹ เช‰เชชเชฏเซ‹เช— เช•เชฐเซ‡ เช›เซ‡.

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ
Hadoop เชฎเชพเช‚ Parquet เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ‡ เชธเชฎเชœเชตเชพ เชฎเชพเชŸเซ‡, เชคเชฎเชพเชฐเซ‡ เชจเซ€เชšเซ‡เชจเชพ เชถเชฌเซเชฆเซ‹ เชœเชพเชฃเชตเชพเชจเซ€ เชœเชฐเซ‚เชฐ เช›เซ‡:

  1. เชชเช‚เช•เซเชคเชฟ เชœเซ‚เชฅ (เชชเช‚เช•เซเชคเชฟ เชœเซ‚เชฅ): เชชเช‚เช•เซเชคเชฟเช“เชฎเชพเช‚ เชกเซ‡เชŸเชพเชจเซเช‚ เชคเชพเชฐเซเช•เชฟเช• เช†เชกเซเช‚ เชตเชฟเชญเชพเชœเชจ. เชชเช‚เช•เซเชคเชฟ เชœเซ‚เชฅเชฎเชพเช‚ เชกเซ‡เชŸเชพ เชธเซ‡เชŸเชฎเชพเช‚ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎเชจเชพ เชŸเซเช•เชกเชพเชจเซ‹ เชธเชฎเชพเชตเซ‡เชถ เชฅเชพเชฏ เช›เซ‡.
  2. เช•เซ‰เชฒเชฎ เชŸเซเช•เชกเซ‹ (เช•เซ‰เชฒเชฎเชจเซ‹ เชญเชพเช—): เชšเซ‹เช•เซเช•เชธ เช•เซ‰เชฒเชฎเชจเซ‹ เชŸเซเช•เชกเซ‹. เช† เช•เซ‰เชฒเชฎเชจเชพ เชŸเซเช•เชกเชพ เชชเช‚เช•เซเชคเชฟเช“เชจเชพ เชšเซ‹เช•เซเช•เชธ เชœเซ‚เชฅเชฎเชพเช‚ เชฐเชนเซ‡ เช›เซ‡ เช…เชจเซ‡ เชซเชพเช‡เชฒเชฎเชพเช‚ เชธเช‚เชฒเช—เซเชจ เชนเซ‹เชตเชพเชจเซ€ เช–เชพเชคเชฐเซ€ เช†เชชเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡.
  3. เชชเซƒเชทเซเช  (เชชเชพเชจเซเช‚): เช•เซ‰เชฒเชฎเชจเชพ เชŸเซเช•เชกเชพเช“ เชเช• เชชเช›เซ€ เชเช• เชฒเช–เซ‡เชฒเชพ เชชเซƒเชทเซเช เซ‹เชฎเชพเช‚ เชตเชฟเชญเชพเชœเชฟเชค เชฅเชพเชฏ เช›เซ‡. เชชเซƒเชทเซเช เซ‹ เชเช• เชธเชพเชฎเชพเชจเซเชฏ เชถเซ€เชฐเซเชทเช• เชงเชฐเชพเชตเซ‡ เช›เซ‡, เชœเซ‡เชฅเซ€ เชคเชฎเซ‡ เชตเชพเช‚เชšเชคเซ€ เชตเช–เชคเซ‡ เชฌเชฟเชจเชœเชฐเซ‚เชฐเซ€เชจเซ‡ เช›เซ‹เชกเซ€ เชถเช•เซ‹.

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ
เช…เชนเซ€เช‚ เชถเซ€เชฐเซเชทเช•เชฎเชพเช‚ เชซเช•เซเชค เชœเชพเชฆเซเชˆ เชธเช‚เช–เซเชฏเชพ เช›เซ‡ PAR1 (4 เชฌเชพเช‡เชŸเซเชธ) เชœเซ‡ เชซเชพเช‡เชฒเชจเซ‡ Parquet เชซเชพเช‡เชฒ เชคเชฐเซ€เช•เซ‡ เช“เชณเช–เซ‡ เช›เซ‡.

เชซเซ‚เชŸเชฐ เชจเซ€เชšเซ‡ เชฎเซเชœเชฌ เช•เชนเซ‡ เช›เซ‡:

  1. เชซเชพเช‡เชฒ เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพ เชœเซ‡เชฎเชพเช‚ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎเชจเชพ เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพเชจเชพ เชชเซเชฐเชพเชฐเช‚เชญเชฟเช• เช•เซ‹เช“เชฐเซเชกเชฟเชจเซ‡เชŸเซเชธ เชนเซ‹เชฏ เช›เซ‡. เชตเชพเช‚เชšเชคเซ€ เชตเช–เชคเซ‡, เชคเชฎเชพเชฐเซ‡ เชฐเซเชšเชฟเชจเชพ เชคเชฎเชพเชฎ เช•เซ‰เชฒเชฎ เชŸเซเช•เชกเชพเช“ เชถเซ‹เชงเชตเชพ เชฎเชพเชŸเซ‡ เชชเซเชฐเชฅเชฎ เชซเชพเช‡เชฒเชจเซ‹ เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพ เชตเชพเช‚เชšเชตเซ‹ เช†เชตเชถเซเชฏเช• เช›เซ‡. เชชเช›เซ€ เช•เซ‰เชฒเชฎเชจเชพ เชญเชพเช—เซ‹เชจเซ‡ เช•เซเชฐเชฎเชฟเช• เชฐเซ€เชคเซ‡ เชตเชพเช‚เชšเชตเชพ เชœเซ‹เชˆเช. เช…เชจเซเชฏ เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เชตเชฐเซเชเชจ, เชธเซเช•เซ€เชฎเชพ เช…เชจเซ‡ เช•เซ‹เชˆเชชเชฃ เชตเชงเชพเชฐเชพเชจเซ€ เช•เซ€-เชตเซ‡เชฒเซเชฏเซ เชœเซ‹เชกเซ€เชจเซ‹ เชธเชฎเชพเชตเซ‡เชถ เชฅเชพเชฏ เช›เซ‡.
  2. เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพ เชฒเช‚เชฌเชพเชˆ (4 เชฌเชพเช‡เชŸเซเชธ).
  3. เชœเชพเชฆเซเชˆ เชธเช‚เช–เซเชฏเชพ PAR1 (4 เชฌเชพเช‡เชŸเซเชธ).

ORC เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ

เช‘เชชเซเชŸเชฟเชฎเชพเช‡เช เชชเช‚เช•เซเชคเชฟ-เช•เซ‰เชฒเชฎ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸ (เช‘เชชเซเชŸเชฟเชฎเชพเช‡เช เชชเช‚เช•เซเชคเชฟ เช•เซ‰เชฒเชฎ, เช“เช†เชฐเชธเซ€) เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐ เช•เชฐเชตเชพเชจเซ€ เช–เซ‚เชฌ เชœ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เชฐเซ€เชค เชชเซเชฐเชฆเชพเชจ เช•เชฐเซ‡ เช›เซ‡ เช…เชจเซ‡ เช…เชจเซเชฏ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ€ เชฎเชฐเซเชฏเชพเชฆเชพเช“เชจเซ‡ เชฆเซ‚เชฐ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เชกเชฟเชเชพเช‡เชจ เช•เชฐเชตเชพเชฎเชพเช‚ เช†เชตเซ€ เชนเชคเซ€. เชกเซ‡เชŸเชพเชจเซ‡ เชธเช‚เชชเซ‚เชฐเซเชฃ เช•เซ‹เชฎเซเชชเซ‡เช•เซเชŸ เชธเซเชตเชฐเซ‚เชชเชฎเชพเช‚ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเซ‡ เช›เซ‡, เชœเซ‡ เชคเชฎเชจเซ‡ เชฌเชฟเชจเชœเชฐเซ‚เชฐเซ€ เชตเชฟเช—เชคเซ‹เชจเซ‡ เช›เซ‹เชกเซ€ เชฆเซ‡เชตเชพเชจเซ€ เชฎเช‚เชœเซ‚เชฐเซ€ เช†เชชเซ‡ เช›เซ‡ - เชฎเซ‹เชŸเชพ, เชœเชŸเชฟเชฒ เช…เชฅเชตเชพ เชฎเซ‡เชจเซเชฏเซเช…เชฒเซ€ เชœเชพเชณเชตเชตเชพเชฎเชพเช‚ เช†เชตเซ‡เชฒเชพ เช…เชจเซเช•เซเชฐเชฎเชฃเชฟเช•เชพเช“เชจเชพ เชจเชฟเชฐเซเชฎเชพเชฃเชจเซ€ เชœเชฐเซ‚เชฐ เชตเช—เชฐ.

ORC เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเชพ เชซเชพเชฏเชฆเชพ:

  1. เชเช• เชซเชพเช‡เชฒ เช เชฆเชฐเซ‡เช• เช•เชพเชฐเซเชฏเชจเซเช‚ เช†เช‰เชŸเชชเซเชŸ เช›เซ‡, เชœเซ‡ NameNode (เชจเชพเชฎ เชจเซ‹เชก) เชชเชฐเชจเซ‹ เชญเชพเชฐ เช˜เชŸเชพเชกเซ‡ เช›เซ‡.
  2. Hive เชกเซ‡เชŸเชพ เชชเซเชฐเช•เชพเชฐเซ‹ เชฎเชพเชŸเซ‡ เชธเชชเซ‹เชฐเซเชŸ, เชœเซ‡เชฎเชพเช‚ เชคเชพเชฐเซ€เช– เชธเชฎเชฏ, เชฆเชถเชพเช‚เชถ เช…เชจเซ‡ เชœเชŸเชฟเชฒ เชกเซ‡เชŸเชพ เชชเซเชฐเช•เชพเชฐเซ‹ (เชธเซเชŸเซเชฐเช•เซเชšเชฐ, เชธเซ‚เชšเชฟ, เชจเช•เชถเซ‹ เช…เชจเซ‡ เชฏเซเชจเชฟเชฏเชจ) เชจเซ‹ เชธเชฎเชพเชตเซ‡เชถ เชฅเชพเชฏ เช›เซ‡.
  3. เชตเชฟเชตเชฟเชง เชฐเซ‡เช•เซ‹เชฐเซเชกเชฐเซ€เชกเชฐ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพเช“ เชฆเซเชตเชพเชฐเชพ เชธเชฎเชพเชจ เชซเชพเช‡เชฒเชจเซเช‚ เชเช• เชธเชพเชฅเซ‡ เชตเชพเช‚เชšเชจ.
  4. เชฎเชพเชฐเซเช•เชฐเซเชธ เชฎเชพเชŸเซ‡ เชธเซเช•เซ‡เชจ เช•เชฐเซเชฏเชพ เชตเชฟเชจเชพ เชซเชพเช‡เชฒเซ‹เชจเซ‡ เชตเชฟเชญเชพเชœเชฟเชค เช•เชฐเชตเชพเชจเซ€ เช•เซเชทเชฎเชคเชพ.
  5. เชซเชพเช‡เชฒ เชซเซ‚เชŸเชฐเชฎเชพเช‚ เชฎเชพเชนเชฟเชคเซ€เชจเชพ เช†เชงเชพเชฐเซ‡ เชฐเซ€เชก/เชฐเชพเช‡เชŸ เชชเซเชฐเช•เซเชฐเชฟเชฏเชพเช“ เชฎเชพเชŸเซ‡ เชฎเชนเชคเซเชคเชฎ เชถเช•เซเชฏ เชนเซ€เชช เชฎเซ‡เชฎเชฐเซ€ เชซเชพเชณเชตเชฃเซ€เชจเซ‹ เช…เช‚เชฆเชพเชœ.
  6. เชฎเซ‡เชŸเชพเชกเซ‡เชŸเชพ เชชเซเชฐเซ‹เชŸเซ‹เช•เซ‹เชฒ เชฌเชซเชฐเซเชธ เชฌเชพเชˆเชจเชฐเซ€ เชธเซ€เชฐเซ€เชฏเชฒเชพเชˆเชเซ‡เชถเชจ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เชธเช‚เช—เซเชฐเชนเชฟเชค เชฅเชพเชฏ เช›เซ‡, เชœเซ‡ เชซเซ€เชฒเซเชกเซเชธเชจเซ‡ เช‰เชฎเซ‡เชฐเชตเชพ เช…เชจเซ‡ เชฆเซ‚เชฐ เช•เชฐเชตเชพเชจเซ€ เชฎเช‚เชœเซ‚เชฐเซ€ เช†เชชเซ‡ เช›เซ‡.

เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเซเชธ: เชธเช‚เช•เซเชทเชฟเชชเซเชค เชถเซˆเช•เซเชทเชฃเชฟเช• เชชเซเชฐเซ‹เช—เซเชฐเชพเชฎ
ORC เชเช• เชซเชพเช‡เชฒเชฎเชพเช‚ เชธเซเชŸเซเชฐเชฟเช‚เช—เชจเชพ เชธเช‚เช—เซเชฐเชนเชจเซ‡ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเซ‡ เช›เซ‡, เช…เชจเซ‡ เชธเช‚เช—เซเชฐเชนเชจเซ€ เช…เช‚เชฆเชฐ, เชธเซเชŸเซเชฐเชฟเช‚เช— เชกเซ‡เชŸเชพ เช•เซ‰เชฒเชฎเชฐ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชฎเชพเช‚ เชธเช‚เช—เซเชฐเชนเชฟเชค เชฅเชพเชฏ เช›เซ‡.

ORC เชซเชพเช‡เชฒ เชซเชพเช‡เชฒเชจเชพ เชซเซ‚เชŸเชฐเชฎเชพเช‚ เชชเชŸเซเชŸเชพเช“ เช…เชจเซ‡ เชธเชนเชพเชฏเช• เชฎเชพเชนเชฟเชคเซ€ เชคเชฐเซ€เช•เซ‡ เช“เชณเช–เชพเชคเซ€ เชฐเซ‡เช–เชพเช“เชจเชพ เชœเซ‚เชฅเซ‹เชจเซ‡ เชธเช‚เช—เซเชฐเชนเชฟเชค เช•เชฐเซ‡ เช›เซ‡. เชซเชพเช‡เชฒเชจเชพ เช…เช‚เชคเซ‡ เชชเซ‹เชธเซเชŸเชธเซเช•เซเชฐเซ€เชชเซเชŸเชฎเชพเช‚ เช•เชฎเซเชชเซเชฐเซ‡เชถเชจ เชชเชฐเชฟเชฎเชพเชฃเซ‹ เช…เชจเซ‡ เชธเช‚เช•เซเชšเชฟเชค เชซเซ‚เชŸเชฐเชจเซเช‚ เช•เชฆ เชถเชพเชฎเซ‡เชฒ เช›เซ‡.

เชกเชฟเชซเซ‰เชฒเซเชŸ เชธเซเชŸเซเชฐเชพเช‡เชชเชจเซเช‚ เช•เชฆ 250 MB เช›เซ‡. เช†เชตเชพ เชฎเซ‹เชŸเชพ เชชเชŸเซเชŸเชพเช“เชจเซ‡ เชฒเซ€เชงเซ‡, HDFS เชฎเชพเช‚เชฅเซ€ เชตเชพเช‚เชšเชจ เชตเชงเซ เช…เชธเชฐเช•เชพเชฐเช• เชฐเซ€เชคเซ‡ เช•เชฐเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡: เชฎเซ‹เชŸเชพ เชธเช‚เชฒเช—เซเชจ เชฌเซเชฒเซ‹เช•เซเชธเชฎเชพเช‚.

เชซเชพเช‡เชฒ เชซเซ‚เชŸเชฐ เชซเชพเช‡เชฒเชฎเชพเช‚ เชฒเซ‡เชจเชจเซ€ เชธเซ‚เชšเชฟ, เชฒเซ‡เชจ เชฆเซ€เช  เชชเช‚เช•เซเชคเชฟเช“เชจเซ€ เชธเช‚เช–เซเชฏเชพ เช…เชจเซ‡ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎเชจเซ‹ เชกเซ‡เชŸเชพ เชชเซเชฐเช•เชพเชฐ เชฐเซ‡เช•เซ‹เชฐเซเชก เช•เชฐเซ‡ เช›เซ‡. เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎ เชฎเชพเชŸเซ‡ เช—เชฃเชคเชฐเซ€, เชฒเช˜เซเชคเซเชคเชฎ, เชฎเชนเชคเซเชคเชฎ เช…เชจเซ‡ เชธเชฐเชตเชพเชณเซ‹เชจเซเช‚ เชชเชฐเชฟเชฃเชพเชฎเซ€ เชฎเซ‚เชฒเซเชฏ เชชเชฃ เชคเซเชฏเชพเช‚ เชฒเช–เซ‡เชฒเซเช‚ เช›เซ‡.

เชธเซเชŸเซเชฐเซ€เชชเชจเชพ เชซเซ‚เชŸเชฐเชฎเชพเช‚ เชธเซเชŸเซเชฐเซ€เชฎ เชธเซเชฅเชพเชจเซ‹เชจเซ€ เชกเชฟเชฐเซ‡เช•เซเชŸเชฐเซ€ เชถเชพเชฎเซ‡เชฒ เช›เซ‡.

เช•เซ‹เชทเซเชŸเช•เซ‹ เชธเซเช•เซ‡เชจ เช•เชฐเชคเซ€ เชตเช–เชคเซ‡ เชชเช‚เช•เซเชคเชฟ เชกเซ‡เชŸเชพเชจเซ‹ เช‰เชชเชฏเซ‹เช— เชฅเชพเชฏ เช›เซ‡.

เช‡เชจเซเชกเซ‡เช•เซเชธ เชกเซ‡เชŸเชพเชฎเชพเช‚ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎ เชฎเชพเชŸเซ‡ เชฒเช˜เซเชคเซเชคเชฎ เช…เชจเซ‡ เชฎเชนเชคเซเชคเชฎ เชฎเซ‚เชฒเซเชฏเซ‹ เช…เชจเซ‡ เชฆเชฐเซ‡เช• เช•เซ‰เชฒเชฎเชฎเชพเช‚ เชชเช‚เช•เซเชคเชฟเช“เชจเซ€ เชธเซเชฅเชฟเชคเชฟเชจเซ‹ เชธเชฎเชพเชตเซ‡เชถ เชฅเชพเชฏ เช›เซ‡. ORC เช‡เชจเซเชกเซ‡เช•เซเชธเชจเซ‹ เช‰เชชเชฏเซ‹เช— เชซเช•เซเชค เชชเชŸเซเชŸเชพเช“ เช…เชจเซ‡ เชชเช‚เช•เซเชคเชฟ เชœเซ‚เชฅเซ‹ เชชเชธเช‚เชฆ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เชฅเชพเชฏ เช›เซ‡, เชชเซเชฐเชถเซเชจเซ‹เชจเชพ เชœเชตเชพเชฌ เช†เชชเชตเชพ เชฎเชพเชŸเซ‡ เชจเชนเซ€เช‚.

เชตเชฟเชตเชฟเชง เชซเชพเช‡เชฒ เชซเซ‹เชฐเซเชฎเซ‡เชŸเชจเซ€ เชธเชฐเช–เชพเชฎเชฃเซ€

Parquet เชธเชฐเช–เชพเชฎเชฃเซ€เชฎเชพเช‚ Avro

  1. เชเชตเชฐเซ‹ เชเช• เชชเช‚เช•เซเชคเชฟ เชธเซเชŸเซ‹เชฐเซ‡เชœ เชซเซ‹เชฐเซเชฎเซ‡เชŸ เช›เซ‡, เชœเซเชฏเชพเชฐเซ‡ Parquet เช•เซ‰เชฒเชฎเชฎเชพเช‚ เชกเซ‡เชŸเชพ เชธเซเชŸเซ‹เชฐ เช•เชฐเซ‡ เช›เซ‡.
  2. เชตเชฟเชถเซเชฒเซ‡เชทเชฃเชพเชคเซเชฎเช• เช•เซเชตเซ‡เชฐเซ€ เชฎเชพเชŸเซ‡ Parquet เชตเชงเซ เชฏเซ‹เช—เซเชฏ เช›เซ‡, เชเชŸเชฒเซ‡ เช•เซ‡ เชฐเซ€เชก เช“เชชเชฐเซ‡เชถเชจเซเชธ เช…เชจเซ‡ เช•เซเชตเซ‡เชฐเซ€ เชกเซ‡เชŸเชพ เชฒเช–เชตเชพ เช•เชฐเชคเชพเช‚ เชตเชงเซ เช•เชพเชฐเซเชฏเช•เซเชทเชฎ เช›เซ‡.
  3. เชเชตเชฐเซ‹เชฎเชพเช‚ เชฒเช–เชตเชพเชจเซ€ เช•เชพเชฎเช—เซ€เชฐเซ€ Parquet เช•เชฐเชคเชพเช‚ เชตเชงเซ เช…เชธเชฐเช•เชพเชฐเช• เชฐเซ€เชคเซ‡ เช•เชฐเชตเชพเชฎเชพเช‚ เช†เชตเซ‡ เช›เซ‡.
  4. เชเชตเชฐเซ‹ เชธเชฐเซเช•เชฟเชŸ เช‰เชคเซเช•เซเชฐเชพเช‚เชคเชฟ เชธเชพเชฅเซ‡ เชตเชงเซ เชชเชฐเชฟเชชเช•เซเชตเชคเชพเชฅเซ€ เชตเซเชฏเชตเชนเชพเชฐ เช•เชฐเซ‡ เช›เซ‡. Parquet เชฎเชพเชคเซเชฐ เชธเซเช•เซ€เชฎเชพ เชเชกเชฟเชถเชจเชจเซ‡ เชธเชชเซ‹เชฐเซเชŸ เช•เชฐเซ‡ เช›เซ‡, เชœเซเชฏเชพเชฐเซ‡ Avro เชฎเชฒเซเชŸเชฟเชซเช‚เช•เซเชถเชจเชฒ เช‡เชตเซ‹เชฒเซเชฏเซเชถเชจเชจเซ‡ เชธเชชเซ‹เชฐเซเชŸ เช•เชฐเซ‡ เช›เซ‡, เชเชŸเชฒเซ‡ เช•เซ‡ เช•เซ‰เชฒเชฎ เช‰เชฎเซ‡เชฐเชตเชพ เช…เชฅเชตเชพ เชฌเชฆเชฒเชตเชพเชจเซเช‚.
  5. เชฎเชฒเซเชŸเชฟ-เช•เซ‰เชฒเชฎ เช•เซ‹เชทเซเชŸเช•เชฎเชพเช‚ เช•เซ‰เชฒเชฎเชจเชพ เชธเชฌเชธเซ‡เชŸเชจเซ€ เชชเซ‚เช›เชชเชฐเช› เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เชฒเชพเช•เชกเชพเชจเซเช‚ เชชเชพเชคเชณเซเช‚ เชชเชก เช†เชฆเชฐเซเชถ เช›เซ‡. เชเชตเชฐเซ‹ ETL เช‘เชชเชฐเซ‡เชถเชจเซเชธ เชฎเชพเชŸเซ‡ เชฏเซ‹เช—เซเชฏ เช›เซ‡ เชœเซเชฏเชพเช‚ เช…เชฎเซ‡ เชคเชฎเชพเชฎ เช•เซ‰เชฒเชฎเชจเซ‡ เช•เซเชตเซ‡เชฐเซ€ เช•เชฐเซ€เช เช›เซ€เช.

ORC vs Parquet

  1. Parquet เชจเซ‡เชธเซเชŸเซ‡เชก เชกเซ‡เชŸเชพเชจเซ‡ เชตเชงเซ เชธเชพเชฐเซ€ เชฐเซ€เชคเซ‡ เชธเซเชŸเซ‹เชฐ เช•เชฐเซ‡ เช›เซ‡.
  2. ORC เชชเซเชถเชกเชพเช‰เชจเชจเซ€ เช†เช—เชพเชนเซ€ เช•เชฐเชตเชพ เชฎเชพเชŸเซ‡ เชตเชงเซ เชฏเซ‹เช—เซเชฏ เช›เซ‡.
  3. ORC ACID เช—เซเชฃเชงเชฐเซเชฎเซ‹เชจเซ‡ เชธเชชเซ‹เชฐเซเชŸ เช•เชฐเซ‡ เช›เซ‡.
  4. ORC เชกเซ‡เชŸเชพเชจเซ‡ เชตเชงเซ เชธเชพเชฐเซ€ เชฐเซ€เชคเซ‡ เชธเช‚เช•เซเชšเชฟเชค เช•เชฐเซ‡ เช›เซ‡.

เชตเชฟเชทเชฏ เชชเชฐ เชฌเซ€เชœเซเช‚ เชถเซเช‚ เชตเชพเช‚เชšเชตเซเช‚:

  1. เช•เซเชฒเชพเช‰เชกเชฎเชพเช‚ เชฎเซ‹เชŸเชพ เชกเซ‡เชŸเชพ เชตเชฟเชถเซเชฒเซ‡เชทเชฃ: เช•เช‚เชชเชจเซ€ เช•เซ‡เชตเซ€ เชฐเซ€เชคเซ‡ เชกเซ‡เชŸเชพ-เชฒเช•เซเชทเซ€ เชฌเชจเซ€ เชถเช•เซ‡ เช›เซ‡.
  2. เชกเซ‡เชŸเชพเชฌเซ‡เช เชธเซเช•เซ€เชฎเชพ เชฎเชพเชŸเซ‡ เชจเชฎเซเชฐ เชฎเชพเชฐเซเช—เชฆเชฐเซเชถเชฟเช•เชพ.
  3. เชกเชฟเชœเชฟเชŸเชฒ เชŸเซเชฐเชพเชจเซเชธเชซเซ‹เชฐเซเชฎเซ‡เชถเชจ เชตเชฟเชถเซ‡ เช…เชฎเชพเชฐเซ€ เชŸเซ‡เชฒเชฟเช—เซเชฐเชพเชฎ เชšเซ‡เชจเชฒ.

เชธเซ‹เชฐเซเชธ: www.habr.com

เชเช• เชŸเชฟเชชเซเชชเชฃเซ€ เช‰เชฎเซ‡เชฐเซ‹