เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบžเบงเบเป€เบฎเบปเบฒเบญเบฒเป„เบชเบขเบนเปˆเปƒเบ™เป„เบฅเบเบฐเป€เบงเบฅเบฒเบ—เบตเปˆเบซเบ™เป‰เบฒเบญเบฑเบ”เบชเบฐเบˆเบฑเบ™เบ—เบตเปˆเบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบŠเบทเปˆเบญเบกเบ•เปเปˆเป„เบ”เป‰เป„เบงเปเบฅเบฐเบ‡เปˆเบฒเบเบ”เบฒเบเบซเบผเบฒเบเป€เบ„เบทเปˆเบญเบ‡เบกเบท open-source เบ—เบตเปˆเบžเป‰เบญเบกเบ—เบตเปˆเบˆเบฐเป€เบฎเบฑเบ”, เบ•เบฑเป‰เบ‡เบ„เปˆเบฒเปƒเบซเป‰เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒ "เบ›เบดเบ”เบชเบฐเบ•เบด" เบ•เบฒเบกเบ„เปเบฒเปเบ™เบฐเบ™เปเบฒเบ‚เบญเบ‡ stackoverflow, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™ delving เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™ "เบซเบผเบฒเบเบ•เบปเบงเบญเบฑเบเบชเบญเบ™", เปเบฅเบฐเป€เบ›เบตเบ”เบ•เบปเบง. เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบเบฒเบ™เบ„เป‰เบฒ. เปเบฅเบฐเปƒเบ™เป€เบงเบฅเบฒเบ—เบตเปˆเบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป„เบ”เป‰เบ›เบฑเบšเบ›เบธเบ‡ / เบ‚เบฐเบซเบเบฒเบเบซเบผเบทเบœเบนเป‰เปƒเบ”เบœเบนเป‰เบซเบ™เบถเปˆเบ‡ reboots เบชเบญเบ‡เบชเบฒเบกเป€เบ„เบทเปˆเบญเบ‡เป‚เบ”เบเบšเบฑเบ‡เป€เบญเบตเบ™ - เบ—เปˆเบฒเบ™เบฎเบนเป‰เบงเปˆเบฒเบšเบฒเบ‡เบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡เบ„เบงเบฒเบกเบเบฑเบ™เบฎเป‰เบฒเบ obsessive เป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เปƒเบ™เบ„เบงเบฒเบกเป€เบ›เบฑเบ™เบˆเบดเบ‡เปเบฅเป‰เบง, เบ—เบธเบเบชเบดเปˆเบ‡เบ—เบธเบเบขเปˆเบฒเบ‡เป„เบ”เป‰เบเบฒเบเบกเบฒเป€เบ›เบฑเบ™เบขเปˆเบฒเบ‡เบเบฐเบ—เบฑเบ™เบซเบฑเบ™เบชเบฑเบšเบชเบปเบ™เบซเบผเบฒเบเบเปˆเบงเบฒเบเบฒเบ™เบฎเบฑเบšเบฎเบนเป‰, เบšเปเปˆเบกเบตเบเบฒเบ™เบซเบฑเบ™เบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™, เบญเบฐเบ™เบฒเบ„เบปเบ”เปเบกเปˆเบ™ vague. เปเบฅเบฐเบ›เบญเบ”เป„เบžเบเบงเปˆเบฒ, เปเบ—เบ™เบ—เบตเปˆเบˆเบฐเบ”เปเบฒเป€เบ™เบตเบ™เป‚เบ„เบ‡เบเบฒเบ™, เบ›เบฑเบšเบ›เบธเบ‡เบžเบฑเบ™เป€เบœเบดเป‰เบ‡เปเบฅเบฐเป€เบฎเบฑเบ”เป€เบ™เบตเบเปเบ‚เบ‡.

เบกเบฑเบ™เบšเปเปˆเปเบกเปˆเบ™เบชเปเบฒเบฅเบฑเบšเบšเปเปˆเบกเบตเบซเบเบฑเบ‡เบ—เบตเปˆเป€เบžเบทเปˆเบญเบ™เบฎเปˆเบงเบกเบ‡เบฒเบ™เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เบซเบผเบฒเบเบเบงเปˆเบฒ, เป‚เบ”เบเบซเบปเบงเบ‚เบญเบ‡เบžเบงเบเป€เบ‚เบปเบฒเป€เบ•เบฑเบกเป„เบ›เบ”เป‰เบงเบเปเบกเบ‡เป„เบกเป‰เปเบฅเบฐเบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบˆเบถเปˆเบ‡เบกเบตเบชเบตเบ‚เบตเป‰เป€เบ–เบปเปˆเบฒเปเบฅเป‰เบง, เบžเบดเบˆเบฒเบฅเบฐเบ™เบฒเบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบŠเบธเบ”เบ‚เบญเบ‡ "เบ•เบนเป‰เบ„เบญเบ™เป€เบ—เบ™เป€เบ™เบต" เบ—เบตเปˆเป„เบงเบขเปˆเบฒเบ‡เบšเปเปˆเบซเบ™เป‰เบฒเป€เบŠเบทเปˆเบญเปƒเบ™ "cubes" เปƒเบ™เบซเบฅเบฒเบเบชเบดเบšเป€เบŠเบตเบŸเป€เบงเบตเปƒเบ™ "เบžเบฒเบชเบฒเบ„เบปเบ™เบญเบฑเบšเป€เบ”เบ”:" เบ—เบตเปˆเบกเบตเบเบฒเบ™เบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™เปƒเบ™เบ•เบปเบง. I/O เบ—เบตเปˆเบšเปเปˆเบ›เบดเบ”เบเบฑเป‰เบ™เปเบšเบšเบšเปเปˆเบŠเบดเป‰เบ‡เป‚เบ„เบ™, เบเบดเป‰เบกเปเบšเบšเบญเปˆเบญเบ™เป‚เบเบ™. เปเบฅเบฐเบžเบงเบเป€เบ‚เบปเบฒเบชเบทเบšเบ•เปเปˆเบญเปˆเบฒเบ™ "man ps", เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบฅเบฐเบซเบฑเบ”เปเบซเบผเปˆเบ‡ "nginx" เบˆเบปเบ™เบเปˆเบงเบฒเบ•เบฒเบ‚เบญเบ‡เบžเบงเบเป€เบ‚เบปเบฒเป€เบฅเบทเบญเบ”เบญเบญเบ, เปเบฅเบฐเบ‚เบฝเบ™, เบ‚เบฝเบ™, เบ‚เบฝเบ™เบเบฒเบ™เบ—เบปเบ”เบชเบญเบšเบซเบ™เปˆเบงเบ. เป€เบžเบทเปˆเบญเบ™เบฎเปˆเบงเบกเบ‡เบฒเบ™เบฎเบนเป‰เบงเปˆเบฒเบชเบดเปˆเบ‡เบ—เบตเปˆเบซเบ™เป‰เบฒเบชเบปเบ™เปƒเบˆเบ—เบตเปˆเบชเบธเบ”เบˆเบฐเบกเบฒเป€เบกเบทเปˆเบญ "เบชเบดเปˆเบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”เบ™เบตเป‰" เบกเบทเป‰เบซเบ™เบถเปˆเบ‡เบ–เบทเบเบงเบฒเบ‡เป„เบงเป‰เปƒเบ™เบ•เบญเบ™เบเบฒเบ‡เบ„เบทเบ™เปƒเบ™เบงเบฑเบ™เบ›เบตเปƒเบซเบกเปˆ. เปเบฅเบฐเบžเบงเบเป€เบ‚เบปเบฒเบžเบฝเบ‡เปเบ•เปˆเบˆเบฐเป„เบ”เป‰เบฎเบฑเบšเบเบฒเบ™เบŠเปˆเบงเบเป‚เบ”เบเบ„เบงเบฒเบกเป€เบ‚เบปเป‰เบฒเปƒเบˆเบขเปˆเบฒเบ‡เป€เบฅเบดเบเป€เบŠเบดเปˆเบ‡เบเปˆเบฝเบงเบเบฑเบšเบฅเบฑเบเบชเบฐเบ™เบฐเบ‚เบญเบ‡ unix, เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบฅเบฑเบ” TCP / IP เบ—เบตเปˆเบ–เบทเบเบˆเบปเบ”เบˆเปเบฒเปเบฅเบฐเบงเบดเบ—เบตเบเบฒเบ™เบˆเบฑเบ”เบฅเบฝเบ‡ - เบ„เบปเป‰เบ™เบซเบฒเบ‚เบฑเป‰เบ™เบžเบทเป‰เบ™เบ–เบฒเบ™. เป€เบžเบทเปˆเบญโ€‹เป€เบฎเบฑเบ”โ€‹เปƒเบซเป‰โ€‹เบฅเบฐโ€‹เบšเบปเบšโ€‹เบเบฑเบšโ€‹เบ„เบทเบ™โ€‹เบกเบฒโ€‹เบกเบตโ€‹เบŠเบตโ€‹เบงเบดเบ”โ€‹เปƒเบ™โ€‹เบ‚เบฐโ€‹เบ™เบฐโ€‹เบ—เบตเปˆโ€‹เบเบฐโ€‹เบ”เบดเปˆเบ‡โ€‹เบ›เบฐโ€‹เบ—เป‰เบงเบ‡โ€‹.

เป‚เบญเป‰, เบ‚เป‰เบญเบเป„เบ”เป‰เบฅเบปเบšเบเบงเบ™เป€เบฅเบฑเบเบ™เป‰เบญเบ, เปเบ•เปˆเบ‚เป‰เบญเบเบซเบงเบฑเบ‡เบงเปˆเบฒเบ‚เป‰เบญเบเบˆเบฐเบชเบฒเบกเบฒเบ”เบ–เปˆเบฒเบเบ—เบญเบ”เบชเบฐเบ–เบฒเบ™เบฐเบเบฒเบ™เบ—เบตเปˆเบ„เบฒเบ”เป„เบงเป‰เป„เบ”เป‰.
เบกเบทเป‰เบ™เบตเป‰เบ‚เป‰เบญเบเบขเบฒเบเปเบšเปˆเบ‡เบ›เบฑเบ™เบ›เบฐเบชเบปเบšเบเบฒเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเปƒเบ™เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰ stack เบ—เบตเปˆเบชเบฐเบ”เบงเบเปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเบชเปเบฒเบฅเบฑเบš DataLake, เป€เบŠเบดเปˆเบ‡เปเบเป‰เป„เบ‚เบชเปˆเบงเบ™เปƒเบซเบเปˆเบ‚เบญเบ‡เบงเบฝเบเบ‡เบฒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เปเบšเปˆเบ‡เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เบซเบกเบปเบ”.

เบšเบฒเบ‡เบ„เบฑเป‰เบ‡เบเปˆเบญเบ™เบซเบ™เป‰เบฒเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เป€เบ‚เบปเป‰เบฒเปƒเบˆเป€เบ–เบดเบ‡เบงเปˆเบฒเบšเปเบฅเบดเบชเบฑเบ”เบ•เป‰เบญเบ‡เบเบฒเบ™เบซเบกเบฒเบเบœเบปเบ™เบ‚เบญเบ‡เบ—เบฑเบ‡เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบœเบฐเบฅเบดเบ”เบ•เบฐเบžเบฑเบ™เปเบฅเบฐเบ”เป‰เบฒเบ™เบงเบดเบŠเบฒเบเบฒเบ™ (เบšเปเปˆเปƒเบซเป‰เป€เบงเบปเป‰เบฒเป€เบ–เบดเบ‡ icing เปƒเบ™ cake เปƒเบ™เบฎเบนเบšเปเบšเบšเบเบฒเบ™เบฎเบฝเบ™เบฎเบนเป‰เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ) เปเบฅเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเปเบ™เบงเป‚เบ™เป‰เบกเปเบฅเบฐเบ„เบงเบฒเบกเบชเปˆเบฝเบ‡ - เบžเบงเบเป€เบฎเบปเบฒเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบเบฑเบšเบเปเบฒเปเบฅเบฐเบงเบดเป€เบ„เบฒเบฐ. metrics เบซเบผเบฒเบเปเบฅเบฐเบซเบผเบฒเบ.

เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ”เป‰เบฒเบ™เบงเบดเบŠเบฒเบเบฒเบ™เบžเบทเป‰เบ™เบ–เบฒเบ™เปƒเบ™ Bitrix24

เป€เบกเบทเปˆเบญเบซเบฅเบฒเบเบ›เบตเบเปˆเบญเบ™, เบžเป‰เบญเบกเบเบฑเบ™เบเบฑเบšเบเบฒเบ™เป€เบ›เบตเบ”เบ•เบปเบงเบšเปเบฅเบดเบเบฒเบ™ Bitrix24, เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบฅเบปเบ‡เบ—เบถเบ™เป€เบงเบฅเบฒ เปเบฅเบฐเบŠเบฑเบšเบžเบฐเบเบฒเบเบญเบ™เบขเปˆเบฒเบ‡เบˆเบดเบ‡เบˆเบฑเบ‡เปƒเบ™เบเบฒเบ™เบชเป‰เบฒเบ‡เปเบžเบฅเบฐเบ•เบฐเบŸเบญเบกเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบ เปเบฅเบฐเป€เบŠเบทเปˆเบญเบ–เบทเป„เบ”เป‰ เป€เบŠเบดเปˆเบ‡เบˆเบฐเบŠเปˆเบงเบเปƒเบซเป‰เป€เบซเบฑเบ™เบšเบฑเบ™เบซเบฒเปƒเบ™เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบžเบทเป‰เบ™เบ–เบฒเบ™เบขเปˆเบฒเบ‡เบงเปˆเบญเบ‡เป„เบง เปเบฅเบฐเบงเบฒเบ‡เปเบœเบ™เบ‚เบฑเป‰เบ™เบ•เบญเบ™เบ•เปเปˆเป„เบ›. เปเบ™เปˆเบ™เบญเบ™, เบ„เบงเบ™เปƒเบŠเป‰เป€เบ„เบทเปˆเบญเบ‡เบกเบทเบ—เบตเปˆเบเบฝเบกเบžเป‰เบญเบกเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰เป€เบ—เบปเปˆเบฒเบ—เบตเปˆเป€เบ›เบฑเบ™เป„เบ›เป„เบ”เป‰. เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, nagios เป„เบ”เป‰เบ–เบทเบเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ•เบดเบ”เบ•เบฒเบกเบเบงเบ”เบเบฒเปเบฅเบฐ munin เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเปเบฅเบฐเบเบฒเบ™เป€เบšเบดเปˆเบ‡เป€เบซเบฑเบ™. เปƒเบ™เบ›เบฑเบ”เบˆเบธเบšเบฑเบ™เบžเบงเบเป€เบฎเบปเบฒเบกเบตเบเบฒเบ™เบเบงเบ”เบชเบญเบšเบซเบฅเบฒเบเบžเบฑเบ™เบ„เบฑเป‰เบ‡เปƒเบ™ nagios, เบซเบผเบฒเบเบฎเป‰เบญเบเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™ munin, เปเบฅเบฐเป€เบžเบทเปˆเบญเบ™เบฎเปˆเบงเบกเบ‡เบฒเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเปƒเบŠเป‰เบžเบงเบเบกเบฑเบ™เบขเปˆเบฒเบ‡เบชเปเบฒเป€เบฅเบฑเบ”เบœเบปเบ™เบ—เบธเบเป†เบกเบทเป‰. metrics เบกเบตเบ„เบงเบฒเบกเบŠเบฑเบ”เป€เบˆเบ™, เป€เบชเบฑเป‰เบ™เบชเบฐเปเบ”เบ‡เปเบกเปˆเบ™เบˆเบฐเปเบˆเป‰เบ‡, เบฅเบฐเบšเบปเบšเป„เบ”เป‰เป€เบฎเบฑเบ”เบงเบฝเบเบ—เบตเปˆเป€เบŠเบทเปˆเบญเบ–เบทเป„เบ”เป‰เบซเบผเบฒเบเบ›เบตเปเบฅเบฐเบเบฒเบ™เบ—เบปเบ”เบชเบญเบšเปเบฅเบฐเบเบฒเบŸเปƒเบซเบกเปˆเป„เบ”เป‰เบ–เบทเบเป€เบžเบตเปˆเบกเป€เบ‚เบปเป‰เบฒเป€เบ›เบฑเบ™เบ›เบฐเบˆเปเบฒ: เป€เบกเบทเปˆเบญเบžเบงเบเป€เบฎเบปเบฒเป€เบญเบปเบฒเบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™เปƒเบซเบกเปˆเป€เบ‚เบปเป‰เบฒเบกเบฒ, เบžเบงเบเป€เบฎเบปเบฒเป€เบžเบตเปˆเบกเบเบฒเบ™เบ—เบปเบ”เบชเบญเบšเปเบฅเบฐเบเบฒเบŸเบซเบผเบฒเบเป†เบ„เบฑเป‰เบ‡. เป‚เบŠเบโ€‹เบ”เบต.

Finger on the Pulse - เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ”เป‰เบฒเบ™เบงเบดเบŠเบฒเบเบฒเบ™เบ‚เบฑเป‰เบ™เบชเบนเบ‡

เบ„เบงเบฒเบกเบ›เบฒเบ–เบฐเบซเบ™เบฒเบ—เบตเปˆเบˆเบฐเป„เบ”เป‰เบฎเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบเปˆเบฝเบงเบเบฑเบšเบšเบฑเบ™เบซเบฒ "เป„เบงเป€เบ—เบปเปˆเบฒเบ—เบตเปˆเบˆเบฐเป„เบงเป„เบ”เป‰" เป„เบ”เป‰เบ™เปเบฒเบžเบฒเบžเบงเบเป€เบฎเบปเบฒเป„เบ›เบชเบนเปˆเบเบฒเบ™เบ—เบปเบ”เบฅเบญเบ‡เบขเปˆเบฒเบ‡เบซเป‰เบฒเบงเบซเบฑเบ™เบ”เป‰เบงเบเป€เบ„เบทเปˆเบญเบ‡เบกเบทเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰ - pinba เปเบฅเบฐ xhprof .

Pinba เป„เบ”เป‰เบชเบปเปˆเบ‡เบชเบฐเบ–เบดเบ•เบดเปƒเบซเป‰เบžเบงเบเป€เบฎเบปเบฒเปƒเบ™เปเบžเบฑเบเป€เบเบฑเบ” UDP เบเปˆเบฝเบงเบเบฑเบšเบ„เบงเบฒเบกเป„เบงเบ‚เบญเบ‡เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ‚เบญเบ‡เบšเบฒเบ‡เบชเปˆเบงเบ™เบ‚เบญเบ‡เบซเบ™เป‰เบฒเป€เบงเบฑเบšเบ•เปˆเบฒเบ‡เป†เปƒเบ™ PHP, เปเบฅเบฐเบžเบงเบเป€เบฎเบปเบฒเบชเบฒเบกเบฒเบ”เป€เบšเบดเปˆเบ‡เบญเบญเบ™เป„เบฅเบ™เปŒเบขเบนเปˆเปƒเบ™เบšเปˆเบญเบ™เป€เบเบฑเบšเบกเป‰เบฝเบ™ MySQL (Pinba เบกเบฒเบžเป‰เบญเบกเบเบฑเบšเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ MySQL เบ‚เบญเบ‡เบ•เบปเบ™เป€เบญเบ‡เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเป€เบซเบ”เบเบฒเบ™เป„เบง) เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบชเบฑเป‰เบ™เบ‚เบญเบ‡เบšเบฑเบ™เบซเบฒเปเบฅเบฐเบ•เบญเบšเบชเบฐเบซเบ™เบญเบ‡เบ•เปเปˆ. เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒ. เปเบฅเบฐ xhprof เบญเบฑเบ”เบ•เบฐเป‚เบ™เบกเบฑเบ”เบญเบฐเบ™เบธเบเบฒเบ”เปƒเบซเป‰เบžเบงเบเป€เบฎเบปเบฒเป€เบเบฑเบšเบเปเบฒเบเบฒเบŸเบ‚เบญเบ‡เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบซเบ™เป‰เบฒ PHP เบ—เบตเปˆเบŠเป‰เบฒเบ—เบตเปˆเบชเบธเบ”เบˆเบฒเบเบฅเบนเบเบ„เป‰เบฒเปเบฅเบฐเบงเบดเป€เบ„เบฒเบฐเบชเบดเปˆเบ‡เบ—เบตเปˆเบชเบฒเบกเบฒเบ”เบ™เปเบฒเป„เบ›เบชเบนเปˆเบเบฒเบ™เบ™เบตเป‰ - เบชเบฐเบซเบ‡เบปเบš, เบ–เบญเบเบ™เป‰เปเบฒเบŠเบฒเบซเบผเบทเบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เบ—เบตเปˆเป€เบ‚เบฑเป‰เบกเปเบ‚เบ‡.

เบšเบฒเบ‡เบ„เบฑเป‰เบ‡เบเปˆเบญเบ™เบซเบ™เป‰เบฒเบ™เบตเป‰, เบŠเบธเบ”เป€เบ„เบทเปˆเบญเบ‡เบกเบทเป„เบ”เป‰เบ–เบทเบเป€เบ•เบตเบกเบฅเบปเบ‡เป„เบ›เบ”เป‰เบงเบเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰เบญเบตเบเบญเบฑเบ™เบซเบ™เบถเปˆเบ‡เป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆเบฅเบฐเบšเบปเบšเบเบฒเบ™เบ”เบฑเบ”เบชเบฐเบ™เบตเปเบšเบšเบ›เบตเป‰เบ™เบเบฑเบšเบเบฑเบ™, เบ›เบฐเบ•เบดเบšเบฑเบ”เบขเปˆเบฒเบ‡เบชเบปเบกเบšเบนเบ™เปƒเบ™เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” Lucene เบ—เบตเปˆเบกเบตเบŠเบทเปˆเบชเบฝเบ‡ - Elastic / Kibana. เบ„เบงเบฒเบกเบ„เบดเบ”เบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเบ‚เบญเบ‡เบเบฒเบ™เบšเบฑเบ™เบ—เบถเบเบซเบผเบฒเบเบเบฐเบ—เบนเป‰เบ‚เบญเบ‡เป€เบญเบเบฐเบชเบฒเบ™เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบ”เบฑเบ”เบŠเบฐเบ™เบต Lucene inverse เป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆเป€เบซเบ”เบเบฒเบ™เปƒเบ™เบšเบฑเบ™เบ—เบถเบเปเบฅเบฐเบเบฒเบ™เบ„เบปเป‰เบ™เบซเบฒเบขเปˆเบฒเบ‡เป„เบงเบงเบฒเป‚เบ”เบเบœเปˆเบฒเบ™เบžเบงเบเบกเบฑเบ™เป‚เบ”เบเปƒเบŠเป‰ facet division เป„เบ”เป‰เบเบฒเบเป€เบ›เบฑเบ™เบ›เบฐเป‚เบซเบเบ”เปเบ—เป‰เป†.

เป€เบ–เบดเบ‡เบงเปˆเบฒเบˆเบฐเบกเบตเบฅเบฑเบเบชเบฐเบ™เบฐเบ—เบฒเบ‡เบ”เป‰เบฒเบ™เบงเบดเบŠเบฒเบเบฒเบ™เบ‚เบญเบ‡เบเบฒเบ™เป€เบšเบดเปˆเบ‡เป€เบซเบฑเบ™เปƒเบ™ Kibana เบ—เบตเปˆเบกเบตเปเบ™เบงเบ„เบงเบฒเบกเบ„เบดเบ”เบฅเบฐเบ”เบฑเบšเบ•เปˆเปเบฒเป€เบŠเบฑเปˆเบ™ "bucket" "เป„เบซเบผเบ‚เบถเป‰เบ™" เปเบฅเบฐเบžเบฒเบชเบฒ reinvented เบ‚เบญเบ‡ algebra เบ„เบงเบฒเบกเบชเปเบฒเบžเบฑเบ™เบ—เบตเปˆเบเบฑเบ‡เบšเปเปˆเป„เบ”เป‰เบฅเบทเบกเบซเบกเบปเบ”, เป€เบ„เบทเปˆเบญเบ‡เบกเบทเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ—เบตเปˆเบˆเบฐเบŠเปˆเบงเบเบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบ”เบตเปƒเบ™เบงเบฝเบเบ‡เบฒเบ™เบ”เบฑเปˆเบ‡เบ•เปเปˆเป„เบ›เบ™เบตเป‰:

  • เบฅเบนเบเบ„เป‰เบฒ Bitrix24 เบกเบตเบ‚เปเป‰เบœเบดเบ”เบžเบฒเบ”เบ‚เบญเบ‡ PHP เป€เบ—เบปเปˆเบฒเปƒเบ”เปƒเบ™เบ›เบฐเบ•เบน p1 เปƒเบ™เบŠเบปเปˆเบงเป‚เบกเบ‡เบ—เบตเปˆเบœเปˆเบฒเบ™เบกเบฒเปเบฅเบฐเบญเบฑเบ™เปƒเบ”? เป€เบ‚เบปเป‰เบฒเปƒเบˆ, เปƒเบซเป‰เบญเบฐเป„เบžเปเบฅเบฐเปเบเป‰เป„เบ‚เบขเปˆเบฒเบ‡เป„เบงเบงเบฒ.
  • เบกเบตเบเบฒเบ™เป‚เบ—เบงเบดเบ”เบตเป‚เบญเบซเบผเบฒเบเบ›เบฒเบ™เปƒเบ”เบขเบนเปˆเปƒเบ™เบ›เบฐเบ•เบนเปƒเบ™เป€เบขเบเบฅเบฐเบกเบฑเบ™เปƒเบ™ 24 เบŠเบปเปˆเบงเป‚เบกเบ‡เบ—เบตเปˆเบœเปˆเบฒเบ™เบกเบฒ, เบกเบตเบ„เบธเบ™เบ™เบฐเบžเบฒเบšเปเบ™เบงเปƒเบ” เปเบฅเบฐเบกเบตเบšเบฑเบ™เบซเบฒเบเบฑเบšเบŠเปˆเบญเบ‡/เป€เบ„เบทเบญเบ‚เปˆเบฒเบเบšเป?
  • เบเบฒเบ™เบ—เปเบฒเบ‡เบฒเบ™เบ‚เบญเบ‡เบฅเบฐเบšเบปเบš (เบเบฒเบ™เบ‚เบฐเบซเบเบฒเบ C เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบชเปเบฒเบฅเบฑเบš PHP), เบฅเบงเบšเบฅเบงเบกเบˆเบฒเบเปเบซเบผเปˆเบ‡เปƒเบ™เบเบฒเบ™เบ›เบฑเบšเบ›เบธเบ‡เบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™เบซเบผเป‰เบฒเบชเบธเบ”เปเบฅเบฐ rolled เบญเบญเบเปƒเบซเป‰เบฅเบนเบเบ„เป‰เบฒ, เป€เบฎเบฑเบ”เบงเบฝเบเป„เบ”เป‰เบ”เบตเป€เบ—เบปเปˆเบฒเปƒเบ”? เบกเบตโ€‹เบ„เบงเบฒเบกโ€‹เบœเบดเบ”โ€‹เบžเบฒเบ”โ€‹เบšเป?
  • เบ‚เปเป‰เบกเบนเบ™เบฅเบนเบเบ„เป‰เบฒเป€เบซเบกเบฒเบฐเบเบฑเบšเบซเบ™เปˆเบงเบเบ„เบงเบฒเบกเบˆเปเบฒ PHP เบšเป? เบกเบตเบ‚เปเป‰เบœเบดเบ”เบžเบฒเบ”เปƒเบ”เป†เบเปˆเบฝเบงเบเบฑเบšเบเบฒเบ™เป€เบเบตเบ™เบ„เบงเบฒเบกเบŠเบปเบ‡เบˆเปเบฒเบ—เบตเปˆเบˆเบฑเบ”เบชเบฑเบ™เปƒเบซเป‰เบเบฑเบšเบ‚เบฐเบšเบงเบ™เบเบฒเบ™: "เบญเบญเบเบˆเบฒเบเบ„เบงเบฒเบกเบŠเบปเบ‡เบˆเปเบฒ" เบšเป? เบŠเบญเบโ€‹เบซเบฒโ€‹เปเบฅเบฐ neutralizeโ€‹.

เบ™เบตเป‰เปเบกเปˆเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบ—เบตเปˆเบŠเบฑเบ”เป€เบˆเบ™. เป€เบ–เบดเบ‡เบงเปˆเบฒเบˆเบฐเบกเบตเบเบฒเบ™เบ—เบปเบ”เบชเบญเบšเบขเปˆเบฒเบ‡เบฅเบฐเบญเบฝเบ”เปเบฅเบฐเบซเบผเบฒเบเบฅเบฐเบ”เบฑเบš, เบฅเบนเบเบ„เป‰เบฒ, เบเปเบฅเบฐเบ™เบตเบ—เบตเปˆเบšเปเปˆเบกเบตเบกเบฒเบ”เบ•เบฐเบ–เบฒเบ™เบซเบผเบฒเบเปเบฅเบฐเบ‚เปเป‰เบกเบนเบ™เบเบฒเบ™เบ›เป‰เบญเบ™เบ‚เปเป‰เบกเบนเบ™เป€เบชเบเบซเบฒเบ, เป„เบ”เป‰เบฎเบฑเบšเบ„เบงเบฒเบกเบœเบดเบ”เบžเบฒเบ”เบ—เบตเปˆเบซเบ™เป‰เบฒเบฅเปเบฒเบ„เบฒเบ™เปเบฅเบฐเบšเปเปˆเบ„เบฒเบ”เบ„เบดเบ”, siren เป„เบ”เป‰เบ”เบฑเบ‡เบ‚เบถเป‰เบ™เปเบฅเบฐเบ‚เบฐเบšเบงเบ™เบเบฒเบ™เบ‚เบญเบ‡เบเบฒเบ™เปเบเป‰เป„เบ‚เบขเปˆเบฒเบ‡เบงเปˆเบญเบ‡เป„เบงเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบ™เบญเบเบˆเบฒเบเบ™เบฑเป‰เบ™, kibana เบŠเปˆเบงเบเปƒเบซเป‰เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบˆเบฑเบ”เบเบฒเบ™เปเบˆเป‰เบ‡เป€เบ•เบทเบญเบ™เบชเปเบฒเบฅเบฑเบšเป€เบซเบ”เบเบฒเบ™เบ—เบตเปˆเบเปเบฒเบ™เบปเบ”เป„เบงเป‰, เปเบฅเบฐเปƒเบ™เป€เบงเบฅเบฒเบชเบฑเป‰เบ™เป†, เป€เบ„เบทเปˆเบญเบ‡เบกเบทเปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”เป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป‚เบ”เบเบžเบฐเบ™เบฑเบเบ‡เบฒเบ™เบซเบผเบฒเบเบชเบดเบšเบ„เบปเบ™เบˆเบฒเบเบžเบฐเปเบ™เบเบ•เปˆเบฒเบ‡เป† - เบˆเบฒเบเบเบฒเบ™เบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™เบ”เป‰เบฒเบ™เบงเบดเบŠเบฒเบเบฒเบ™เปเบฅเบฐเบเบฒเบ™เบžเบฑเบ”เบ—เบฐเบ™เบฒเบเบฑเบš QA.

เบเบดเบ”เบˆเบฐเบเปเบฒเบ‚เบญเบ‡เบžเบฐเปเบ™เบเปƒเบ”เบซเบ™เบถเปˆเบ‡เบžเบฒเบเปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”เป„เบ”เป‰เบเบฒเบเป€เบ›เบฑเบ™เบ„เบงเบฒเบกเบชเบฐเบ”เบงเบเปƒเบ™เบเบฒเบ™เบ•เบดเบ”เบ•เบฒเบกเปเบฅเบฐเบเบฒเบ™เบงเบฑเบ”เปเบ—เบ - เปเบ—เบ™เบ—เบตเปˆเบˆเบฐเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบšเบฑเบ™เบ—เบถเบเบ”เป‰เบงเบเบ•เบปเบ™เป€เบญเบ‡เปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เปเบกเปˆเบ‚เปˆเบฒเบ, เบ—เปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบ•เบฑเป‰เบ‡เบšเบฑเบ™เบ—เบถเบเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ„เบฑเป‰เบ‡เบ”เบฝเบงเปเบฅเบฐเบชเบปเปˆเบ‡เบžเบงเบเบกเบฑเบ™เป„เบ›เบซเบฒเบเบธเปˆเบก elastic เป€เบžเบทเปˆเบญเป€เบžเบตเบ”เป€เบžเบตเบ™, เบชเปเบฒเบฅเบฑเบšเบ•เบปเบงเบขเปˆเบฒเบ‡, เบžเบดเบˆเบฒเบฅเบฐเบ™เบฒเปƒเบ™ kibana. dashboard เบˆเปเบฒโ€‹เบ™เบงเบ™โ€‹เบ‚เบญเบ‡โ€‹เบฅเบนเบโ€‹เปเบกเบงโ€‹เบชเบญเบ‡โ€‹เบซเบปเบงโ€‹เบ‚เบฒเบโ€‹เบžเบดเบกโ€‹เปƒเบ™โ€‹เป€เบ„เบทเปˆเบญเบ‡โ€‹เบžเบดเบก 3-D เบชเปเบฒโ€‹เบฅเบฑเบšโ€‹เป€เบ”เบทเบญเบ™โ€‹เบ—เบตเปˆโ€‹เบœเปˆเบฒเบ™โ€‹เบกเบฒโ€‹.

เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบธเบฅเบฐเบเบดเบ”เบžเบทเป‰เบ™เบ–เบฒเบ™

เบ—เบธเบเบ„เบปเบ™เบฎเบนเป‰เบงเปˆเบฒเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบธเบฅเบฐเบเบดเบ”เปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”เบกเบฑเบเบˆเบฐเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ”เป‰เบงเบเบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบขเปˆเบฒเบ‡เบซเป‰เบฒเบงเบซเบฑเบ™, เปเบกเปˆเบ™เปเบฅเป‰เบง, Excel. เปเบ•เปˆเบชเบดเปˆเบ‡เบ—เบตเปˆ เบชเบณ เบ„เบฑเบ™เปเบกเปˆเบ™เบกเบฑเบ™เบšเปเปˆเบชเบดเป‰เบ™เบชเบธเบ”. Cloud-based Google Analytics เบเบฑเบ‡เป€เบžเบตเปˆเบกเบ™เปเป‰เบฒเบกเบฑเบ™เปƒเบซเป‰เบเบฑเบšเป„เบŸ - เบ—เปˆเบฒเบ™เป„เบงเป€เบฅเบตเปˆเบกเบ„เบธเป‰เบ™เป€เบ„เบตเบเบเบฑเบšเบชเบดเปˆเบ‡เบ—เบตเปˆเบ”เบต.

เปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”เบ—เบตเปˆเบเปเบฒเบฅเบฑเบ‡เบžเบฑเบ”เบ—เบฐเบ™เบฒเบขเปˆเบฒเบ‡เบเบปเบกเบเบฝเบงเบเบฑเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒ, เบขเบนเปˆเบ—เบตเปˆเบ™เบตเป‰เปเบฅเบฐเบšเปˆเบญเบ™เบ™เบฑเป‰เบ™ "เบชเบฒเบ”เบชเบฐเบ”เบฒ" เบ‚เบญเบ‡เบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบ—เบตเปˆเป€เบ‚เบฑเป‰เบกเบ‡เบงเบ”เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ›เบฒเบเบปเบ”. เบ„เบงเบฒเบกเบ•เป‰เบญเบ‡เบเบฒเบ™เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฅเบฒเบเบ‡เบฒเบ™เปƒเบ™เบ„เบงเบฒเบกเป€เบฅเบดเบเปเบฅเบฐเบซเบผเบฒเบเบฎเบนเบšเบซเบผเบฒเบเปเบšเบšเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ›เบฒเบเบปเบ”เป€เบ›เบฑเบ™เบ›เบฐเบˆเปเบฒ, เปเบฅเบฐเป‚เบ”เบเบœเปˆเบฒเบ™เบ„เบงเบฒเบกเบžเบฐเบเบฒเบเบฒเบกเบ‚เบญเบ‡ guys เบˆเบฒเบเบžเบฐเปเบ™เบเบ•เปˆเบฒเบ‡เป†, เบšเบฒเบ‡เบ„เบฑเป‰เบ‡เบเปˆเบญเบ™เบซเบ™เป‰เบฒเบ™เบตเป‰เบเบฒเบ™เปเบเป‰เป„เบ‚เบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเบ›เบฐเบ•เบดเบšเบฑเบ”เป„เบ”เป‰เบ–เบทเบเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ - เบเบฒเบ™เบ›เบฐเบชเบปเบกเบ›เบฐเบชเบฒเบ™เบ‚เบญเบ‡ ClickHouse เปเบฅเบฐ PowerBI.

เบชเปเบฒเบฅเบฑเบšเป€เบงเบฅเบฒเบ”เบปเบ™เบ™เบฒเบ™, เบเบฒเบ™เปเบเป‰เป„เบ‚เบ—เบตเปˆเบกเบตเบ„เบงเบฒเบกเบเบทเบ”เบซเบเบธเปˆเบ™เบ™เบตเป‰เบŠเปˆเบงเบเบซเบผเบฒเบ, เปเบ•เปˆเบ„เปˆเบญเบเป†เบ„เบงเบฒเบกเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบงเปˆเบฒ ClickHouse เบšเปเปˆเปเบกเปˆเบ™เบขเบฒเบ‡เปเบฅเบฐเบšเปเปˆเบชเบฒเบกเบฒเบ”เบ–เบทเบเป€เบเบฒเบฐเป€เบเบตเป‰เบเปเบšเบšเบ™เบฑเป‰เบ™.

เปƒเบ™เบ—เบตเปˆเบ™เบตเป‰เบกเบฑเบ™เป€เบ›เบฑเบ™เบชเบดเปˆเบ‡เบชเปเบฒเบ„เบฑเบ™เบ—เบตเปˆเบˆเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเบ”เบตเบงเปˆเบฒ ClickHouse, เป€เบŠเบฑเปˆเบ™ Druid, เป€เบŠเบฑเปˆเบ™ Vertica, เป€เบŠเบฑเปˆเบ™ Amazon RedShift (เป€เบŠเบดเปˆเบ‡เบญเบตเบ‡เปƒเบชเปˆ postgres), เปเบกเปˆเบ™เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเป€เบซเบกเบฒเบฐเบชเบปเบกเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบชเบฐเบ”เบงเบเบžเปเบชเบปเบกเบ„เบงเบ™ (เบœเบปเบ™เบฅเบงเบก, เบเบฒเบ™เบฅเบงเบšเบฅเบงเบก, เบ•เปเบฒเปˆเบชเบธเบ”เบ—เบตเปˆ - เบชเบนเบ‡เบชเบธเบ”เป‚เบ”เบเบ„เปเบฅเปเบฒเปเบฅเบฐเบšเบฒเบ‡เบชเปˆเบงเบ™เบ—เบตเปˆเป€เบ›เบฑเบ™เป„เบ›เป„เบ”เป‰. ), เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบงเปˆเบฒ เบˆเบฑเบ”เบ•เบฑเป‰เบ‡เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเบ„เปเบฅเปเบฒเบ‚เบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบตเปˆเบเปˆเบฝเบงเบ‚เป‰เบญเบ‡เบขเปˆเบฒเบ‡เบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบš, เบšเปเปˆเป€เบซเบกเบทเบญเบ™เบเบฑเบšเบ–เบฒเบ™เบ‚เปเป‰เบกเบนเบ™ MySQL เปเบฅเบฐเบ–เบฒเบ™เบ‚เปเป‰เบกเบนเบ™เบญเบทเปˆเบ™เป† (เปเบ–เบงเบฎเบฑเบ”เบเบธเบก) เบ—เบตเปˆเบฎเบนเป‰เบˆเบฑเบเบเบฑเบšเบžเบงเบเป€เบฎเบปเบฒ.

เป‚เบ”เบเป€เบ™เบทเป‰เบญเปเบ—เป‰เปเบฅเป‰เบง, ClickHouse เปเบกเปˆเบ™เบžเบฝเบ‡เปเบ•เปˆ "เบ–เบฒเบ™เบ‚เปเป‰เบกเบนเบ™" เบ—เบตเปˆเบกเบตเบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เบซเบผเบฒเบ, เบšเปเปˆเบกเบตเบเบฒเบ™เปƒเบชเปˆเบˆเบธเบ”เบ—เบตเปˆเบชเบฐเบ”เบงเบเบซเบผเบฒเบ (เบ™เบฑเป‰เบ™เปเบกเปˆเบ™เบงเบดเบ—เบตเบ—เบตเปˆเบกเบฑเบ™เบกเบตเบˆเบธเบ”เบ›เบฐเบชเบปเบ‡, เบ—เบธเบเบชเบดเปˆเบ‡เบ—เบธเบเบขเปˆเบฒเบ‡เปเบกเปˆเบ™เบ”เบต), เปเบ•เปˆเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบซเบ™เป‰เบฒเบžเปเปƒเบˆเปเบฅเบฐเบŠเบธเบ”เบซเบ™เป‰เบฒเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบ—เบตเปˆเบซเบ™เป‰เบฒเบชเบปเบ™เปƒเบˆเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™. เปเบกเปˆเบ™เปเบฅเป‰เบง, เป€เบˆเบปเป‰เบฒเบชเบฒเบกเบฒเบ”เบชเป‰เบฒเบ‡เบเบธเปˆเบกเป„เบ”เป‰ - เปเบ•เปˆเป€เบˆเบปเป‰เบฒเป€เบ‚เบปเป‰เบฒเปƒเบˆเบงเปˆเบฒเบเบฒเบ™เบ•เบปเบšเป€เบฅเบฑเบšเบ”เป‰เบงเบเบเป‰เบญเบ‡เบˆเบธเบฅเบฐเบ—เบฑเบ”เปเบกเปˆเบ™เบšเปเปˆเบ–เบทเบเบ•เป‰เบญเบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”เปเบฅเบฐเบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เป€เบฅเบตเปˆเบกเบŠเบญเบเบซเบฒเบงเบดเบ—เบตเปเบเป‰เป„เบ‚เบญเบทเปˆเบ™เป†.

เบ„เบงเบฒเบกเบ•เป‰เบญเบ‡เบเบฒเบ™เบชเปเบฒเบฅเบฑเบš python เปเบฅเบฐเบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐ

เบšเปเบฅเบดเบชเบฑเบ”เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบกเบตเบ™เบฑเบเบžเบฑเบ”เบ—เบฐเบ™เบฒเบซเบผเบฒเบเบ„เบปเบ™เบ—เบตเปˆเบ‚เบฝเบ™เบฅเบฐเบซเบฑเบ”เป€เบเบทเบญเบšเบ—เบธเบเป†เบกเบทเป‰เบชเปเบฒเบฅเบฑเบš 10-20 เบ›เบตเปƒเบ™ PHP, JavaScript, C#, C/C ++, Java, Go, Rust, Python, Bash. เบเบฑเบ‡เบกเบตเบœเบนเป‰เบšเปเบฅเบดเบซเบฒเบ™เบฅเบฐเบšเบปเบšเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เบซเบผเบฒเบเบ„เบปเบ™เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เบซเบผเบฒเบเบเบงเปˆเบฒเบซเบ™เบถเปˆเบ‡เป„เบžเบžเบดเบšเบฑเบ”เบ—เบตเปˆเบšเปเปˆเบซเบ™เป‰เบฒเป€เบŠเบทเปˆเบญเบขเปˆเบฒเบ‡เปเบ—เป‰เบˆเบดเบ‡เบ—เบตเปˆเบšเปเปˆเป€เบซเบกเบฒเบฐเบชเบปเบกเบเบฑเบšเบเบปเบ”เบซเบกเบฒเบเบ‚เบญเบ‡เบชเบฐเบ–เบดเบ•เบด (เบ•เบปเบงเบขเปˆเบฒเบ‡เป€เบŠเบฑเปˆเบ™เปƒเบ™เป€เบงเบฅเบฒเบ—เบตเปˆเปเบœเปˆเบ™เบชเปˆเบงเบ™เปƒเบซเบเปˆเปƒเบ™เบเบฒเบ™เป‚เบˆเบกเบ•เบต -10 เบ–เบทเบเบ—เปเบฒเบฅเบฒเบเป‚เบ”เบเบเบฒเบ™เป‚เบˆเบกเบ•เบตเบŸเป‰เบฒเบœเปˆเบฒเบ—เบตเปˆเป€เบ‚เบฑเป‰เบกเปเบ‚เบ‡). เปƒเบ™เบชเบฐเบ–เบฒเบ™เบฐเบเบฒเบ™เบ”เบฑเปˆเบ‡เบเปˆเบฒเบง, เป€เบ›เบฑเบ™เป€เบงเบฅเบฒเบ”เบปเบ™เบ™เบฒเบ™, เบกเบฑเบ™เบšเปเปˆเบŠเบฑเบ”เป€เบˆเบ™เบงเปˆเบฒ "เบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐ python" เปเบกเปˆเบ™เบซเบเบฑเบ‡. Python เปเบกเปˆเบ™เบ„เป‰เบฒเบเบ„เบท PHP, เบžเบฝเบ‡เปเบ•เปˆเบŠเบทเปˆเปเบกเปˆเบ™เบเบฒเบงเป€เบฅเบฑเบเบ™เป‰เบญเบเปเบฅเบฐเบกเบตเบฎเปˆเบญเบ‡เบฎเบญเบเบซเบ™เป‰เบญเบเบ‚เบญเบ‡เบชเบฒเบ™เบ—เบตเปˆเบ›เปˆเบฝเบ™เปเบ›เบ‡เบˆเบดเบ”เปƒเบˆเปƒเบ™เบฅเบฐเบซเบฑเบ”เปเบซเบผเปˆเบ‡เบ‚เบญเบ‡เบ™เบฒเบเบžเบฒเบชเบฒ. เบขเปˆเบฒเบ‡เปƒเบ”เบเปเบ•เบฒเบก, เบเป‰เบญเบ™เบงเปˆเบฒเบšเบปเบ”เบฅเบฒเบเบ‡เบฒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบซเบผเบฒเบเบ‚เบทเป‰เบ™เป„เบ”เป‰เบ–เบทเบเบชเป‰เบฒเบ‡เบ‚เบทเป‰เบ™, เบ™เบฑเบเบžเบฑเบ”เบ—เบฐเบ™เบฒเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เป€เบฅเบตเปˆเบกเป€เบ‚เบปเป‰เบฒเปƒเบˆเบ„เบงเบฒเบกเบชเปเบฒเบ„เบฑเบ™เบ‚เบญเบ‡เบ„เบงเบฒเบกเบŠเปˆเบฝเบงเบŠเบฒเบ™เปเบ„เบšเปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เบกเบทเป€เบŠเบฑเปˆเบ™ numpy, pandas, matplotlib, seaborn.
เบžเบฒเบฅเบฐเบšเบปเบ”เบšเบฒเบ”เบ•เบฑเบ”เบชเบดเบ™, เบชเปˆเบงเบ™เบซเบผเบฒเบเปเบกเปˆเบ™, เป„เบ”เป‰เบ–เบทเบเบซเบผเบตเป‰เบ™เป‚เบ”เบเบเบฒเบ™เบฅเบปเป‰เบกเบฅเบปเบ‡เบขเปˆเบฒเบ‡เบเบฐเบ—เบฑเบ™เบซเบฑเบ™เบ‚เบญเบ‡เบžเบฐเบ™เบฑเบเบ‡เบฒเบ™เบˆเบฒเบเบเบฒเบ™เบ›เบฐเบชเบปเบกเบ›เบฐเบชเบฒเบ™เบ‚เบญเบ‡เบ„เปเบฒเบงเปˆเบฒ "เบเบฒเบ™เบ–เบปเบ”เบ–เบญเบเบ‚เบญเบ‡ logistic" เปเบฅเบฐเบเบฒเบ™เบชเบฐเปเบ”เบ‡เบเบฒเบ™เบฅเบฒเบเบ‡เบฒเบ™เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเปƒเบ™เบ‚เปเป‰เบกเบนเบ™เบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆเป‚เบ”เบเปƒเบŠเป‰, เปเบกเปˆเบ™, เปเบกเปˆเบ™, pyspark.

Apache Spark, เบฎเบนเบšเปเบšเบšเบเบฒเบ™เบ—เปเบฒเบ‡เบฒเบ™เบ‚เบญเบ‡เบกเบฑเบ™เบ—เบตเปˆ algebra เบ—เบตเปˆเบเปˆเบฝเบงเบ‚เป‰เบญเบ‡เป€เบซเบกเบฒเบฐเบขเปˆเบฒเบ‡เบชเบปเบกเบšเบนเบ™, เปเบฅเบฐเบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เบ‚เบญเบ‡เบกเบฑเบ™เป€เบฎเบฑเบ”เปƒเบซเป‰เบ„เบงเบฒเบกเบ›เบฐเบ—เบฑเบšเปƒเบˆเบ‚เบญเบ‡เบ™เบฑเบเบžเบฑเบ”เบ—เบฐเบ™เบฒเบ—เบตเปˆเบ„เบธเป‰เบ™เป€เบ„เบตเบเบเบฑเบš MySQL เบงเปˆเบฒเบ„เบงเบฒเบกเบ•เป‰เบญเบ‡เบเบฒเบ™เบ—เบตเปˆเบˆเบฐเบชเป‰เบฒเบ‡เบ„เบงเบฒเบกเป€เบ‚เบฑเป‰เบกเปเบ‚เบ‡เบเบฒเบ™เบˆเบฑเบ”เบญเบฑเบ™เบ”เบฑเบšเบเบฑเบšเบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เป„เบ”เป‰เบเบฒเบเป€เบ›เบฑเบ™เบ—เบตเปˆเบŠเบฑเบ”เป€เบˆเบ™เปƒเบ™เบกเบทเป‰.

เบ„เบงเบฒเบกเบžเบฐเบเบฒเบเบฒเบกเบ•เบทเปˆเบกเบญเบตเบเบ‚เบญเบ‡ Apache Spark / Hadoop เบ—เบตเปˆเบˆเบฐเป€เบญเบปเบฒเป„เบ›เปเบฅเบฐเบชเบดเปˆเบ‡เบ—เบตเปˆเบšเปเปˆเป„เบ”เป‰เป„เบ›เบ•เบฒเบกเบชเบฐเบ„เบดเบš

เบขเปˆเบฒเบ‡เปƒเบ”เบเปเปˆเบ•เบฒเบก, เบกเบฑเบ™เบ—เบฑเบ™เบ—เบตเบ—เบตเปˆเป€เบซเบฑเบ™เป„เบ”เป‰เบŠเบฑเบ”เป€เบˆเบ™เบงเปˆเบฒเบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เบ—เบตเปˆเป€เบ›เบฑเบ™เบฅเบฐเบšเบปเบšเบšเปเปˆเบ–เบทเบเบ•เป‰เบญเบ‡เบเบฑเบš Spark, เบซเบผเบทเบกเบฑเบ™เป€เบ›เบฑเบ™เบชเบดเปˆเบ‡เบˆเปเบฒเป€เบ›เบฑเบ™เบ—เบตเปˆเบˆเบฐเบฅเป‰เบฒเบ‡เบกเบทเบ‚เบญเบ‡เป€เบˆเบปเป‰เบฒเบ”เบตเบเบงเปˆเบฒ. เบ–เป‰เบฒ Hadoop / MapReduce / Lucene stack เบ–เบทเบเบชเป‰เบฒเบ‡เบ‚เบทเป‰เบ™เป‚เบ”เบเบ™เบฑเบเบ‚เบฝเบ™เป‚เบ›เบฅเปเบเบฅเบกเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เบžเปเบชเบปเบกเบ„เบงเบ™, เป€เบŠเบดเปˆเบ‡เป€เบซเบฑเบ™เป„เบ”เป‰เบŠเบฑเบ”เป€เบˆเบ™เบ–เป‰เบฒเบ—เปˆเบฒเบ™เป€เบšเบดเปˆเบ‡เบขเปˆเบฒเบ‡เปƒเบเป‰เบŠเบดเบ”เบขเบนเปˆเปƒเบ™เบฅเบฐเบซเบฑเบ”เปเบซเบผเปˆเบ‡เปƒเบ™ Java เบซเบผเบทเปเบ™เบงเบ„เบงเบฒเบกเบ„เบดเบ”เบ‚เบญเบ‡ Doug Cutting เปƒเบ™ Lucene, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™ Spark, เบ—เบฑเบ™เบ—เบตเบ—เบฑเบ™เปƒเบ”, เบ–เบทเบเบ‚เบฝเบ™เปƒเบ™เบžเบฒเบชเบฒเปเบ›เบเป† Scala, เป€เบŠเบดเปˆเบ‡เปเบกเปˆเบ™. เบเบฒเบ™เบ‚เบฑเบ”เปเบเป‰เบ‡เบซเบผเบฒเบเบˆเบฒเบเบ—เบฑเบ”เบชเบฐเบ™เบฐเบ‚เบญเบ‡เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ•เบปเบงเบˆเบดเบ‡เปเบฅเบฐเบ›เบฐเบˆเบธเบšเบฑเบ™เบšเปเปˆเป„เบ”เป‰เบžเบฑเบ”เบ—เบฐเบ™เบฒ. เปเบฅเบฐเบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบเบฒเบ™เบซเบผเบธเบ”เบฅเบปเบ‡เป€เบ›เบฑเบ™เบ›เบปเบเบเบฐเบ•เบดเบเปˆเบฝเบงเบเบฑเบšเบเบธเปˆเบก Spark เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบ—เบตเปˆเบšเปเปˆเบกเบตเป€เบซเบ”เบœเบปเบ™เปเบฅเบฐเบšเปเปˆเป‚เบ›เปˆเบ‡เปƒเบชเบซเบผเบฒเบเบเบฑเบšเบเบฒเบ™เบˆเบฑเบ”เบชเบฑเบ™เบซเบ™เปˆเบงเบเบ„เบงเบฒเบกเบˆเปเบฒเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบซเบผเบธเบ”เบœเปˆเบญเบ™เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™ (เบซเบผเบฒเบเบ›เบธเปˆเบกเบกเบฒเบฎเบญเบ”เปƒเบ™เบ„เบฑเป‰เบ‡เบ”เบฝเบง) เป„เบ”เป‰เบชเป‰เบฒเบ‡ halo เบ›เบฐเบกเบฒเบ™เบกเบฑเบ™เบ‚เบญเบ‡เบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เบ—เบตเปˆเบกเบตเบžเบทเป‰เบ™เบ—เบตเปˆเบ—เบตเปˆเบˆเบฐเป€เบ•เบตเบšเป‚เบ•. เบ™เบญเบเบˆเบฒเบเบ™เบฑเป‰เบ™, เบชเบฐเบ–เบฒเบ™เบฐเบเบฒเบ™เบเปเปˆเบฎเป‰เบฒเบเปเบฎเบ‡เบ‚เบถเป‰เบ™เป‚เบ”เบเบŠเปˆเบญเบ‡เบชเบฝเบšเบ—เบตเปˆเปเบ›เบเบ›เบฐเบซเบผเบฒเบ”เบˆเปเบฒเบ™เบงเบ™เบซเบฅเบฒเบ, เป„เบŸเบฅเปŒเบŠเบปเปˆเบงเบ„เบฒเบงเบ—เบตเปˆเป€เบ•เบตเบšเปƒเบซเบเปˆเบขเบนเปˆเปƒเบ™เบชเบฐเบ–เบฒเบ™เบ—เบตเปˆเบ—เบตเปˆเบšเปเปˆเบชเบฒเบกเบฒเบ”เป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰เบซเบผเบฒเบเบ—เบตเปˆเบชเบธเบ”เปเบฅเบฐเบเบฒเบ™เป€เบžเบดเปˆเบ‡เบžเบฒเบญเบฒเป„เบชเบ™เบฐเบฅเบปเบ - เป€เบŠเบดเปˆเบ‡เป€เบฎเบฑเบ”เปƒเบซเป‰เบœเบนเป‰เบšเปเบฅเบดเบซเบฒเบ™เบฅเบฐเบšเบปเบšเบกเบตเบ„เบงเบฒเบกเบฎเบนเป‰เบชเบถเบเบซเบ™เบถเปˆเบ‡เบ—เบตเปˆเบฎเบนเป‰เบˆเบฑเบเบเบฑเบ™เบ”เบตเบˆเบฒเบเป„เบงเป€เบ”เบฑเบ: เบ„เบงเบฒเบกเบเบฝเบ”เบŠเบฑเบ‡เบขเปˆเบฒเบ‡เบฎเบธเบ™เปเบฎเบ‡ (เบซเบผเบทเบšเบฒเบ‡เบ—เบต. เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒเบ•เป‰เบญเบ‡เบฅเป‰เบฒเบ‡เบกเบทเบ”เป‰เบงเบเบชเบฐเบšเบน).

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰ "เบขเบนเปˆเบฅเบญเบ”" เป‚เบ„เบ‡เบเบฒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบžเบฒเบเปƒเบ™เบซเบผเบฒเบเป†เป‚เบ„เบ‡เบเบฒเบ™เบ—เบตเปˆเปƒเบŠเป‰ Apache Spark เบขเปˆเบฒเบ‡เบˆเบดเบ‡เบˆเบฑเบ‡ (เบฅเบงเบกเบ—เบฑเบ‡ Spark Streaming, Spark SQL) เปเบฅเบฐเบฅเบฐเบšเบปเบšเบ™เบดเป€เบงเบ” Hadoop (เปเบฅเบฐเบญเบทเปˆเบ™เป†เปเบฅเบฐเบญเบทเปˆเบ™เป†). เป€เบ–เบดเบ‡เบงเปˆเบฒเบˆเบฐเบกเบตเบ„เบงเบฒเบกเบˆเบดเบ‡เบ—เบตเปˆเบงเปˆเบฒเป€เบกเบทเปˆเบญเป€เบงเบฅเบฒเบœเปˆเบฒเบ™เป„เบ›เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบฎเบฝเบ™เบฎเบนเป‰เบเบฒเบ™เบเบฐเบเบฝเบกเปเบฅเบฐเบ•เบดเบ”เบ•เบฒเบก "เบกเบฑเบ™" เบ‚เป‰เบญเบ™เบ‚เป‰เบฒเบ‡เบ”เบต, เปเบฅเบฐ "เบกเบฑเบ™" เบ›เบฐเบ•เบดเบšเบฑเบ”เป„เบ”เป‰เบขเบธเบ”เป€เบŠเบปเบฒเบขเปˆเบฒเบ‡เบเบฐเบ—เบฑเบ™เบซเบฑเบ™เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบเบฒเบ™เบ›เปˆเบฝเบ™เปเบ›เบ‡เบ‚เบญเบ‡เบ‚เปเป‰เบกเบนเบ™เปเบฅเบฐเบ„เบงเบฒเบกเบšเปเปˆเบชเบปเบกเบ”เบธเบ™เบ‚เบญเบ‡ RDD เบ—เบตเปˆเป€เบ›เบฑเบ™เป€เบญเบเบฐเบžเบฒเบš, เบ„เบงเบฒเบกเบ›เบฒเบ–เบฐเบซเบ™เบฒเบ—เบตเปˆเบˆเบฐเป€เบญเบปเบฒเบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เบ—เบตเปˆเบเบฝเบกเบžเป‰เบญเบกเปเบฅเป‰เบง. , เบ›เบฑเบšเบ›เบธเบ‡เปเบฅเบฐเบšเปเบฅเบดเบซเบฒเบ™เบšเบฒเบ‡เบšเปˆเบญเบ™เบขเบนเปˆเปƒเบ™เบ„เบฅเบฒเบงเป€เบžเบตเปˆเบกเบ‚เบถเป‰เบ™เปเบฅเบฐเป€เบ‚เบฑเป‰เบกเปเบ‚เบ‡. เบกเบฑเบ™เปเบกเปˆเบ™เปƒเบ™เป€เบงเบฅเบฒเบ™เบตเป‰เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบžเบฐเบเบฒเบเบฒเบกเปƒเบŠเป‰เบเบฒเบ™เบ›เบฐเบเบญเบšเป€เบกเบ„เบ—เบตเปˆเบเบฝเบกเบžเป‰เบญเบกเบ‚เบญเบ‡ Amazon Web Services - EMR เปเบฅเบฐ, เบ•เปเปˆเบกเบฒ, เบžเบฐเบเบฒเบเบฒเบกเปเบเป‰เป„เบ‚เบšเบฑเบ™เบซเบฒเบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบกเบฑเบ™. EMR เปเบกเปˆเบ™ Apache Spark เบ—เบตเปˆเบเบฐเบเบฝเบกเป‚เบ”เบ Amazon เบ”เป‰เบงเบเบŠเบญเบšเปเบงเป€เบžเบตเปˆเบกเป€เบ•เบตเบกเบˆเบฒเบเบฅเบฐเบšเบปเบšเบ™เบดเป€เบงเบ”, เบ„เบทเบเบฑเบš Cloudera/Hortonworks builds.

เบเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒเบขเบฒเบ‡เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเปเบกเปˆเบ™เบกเบตเบ„เบงเบฒเบกเบˆเปเบฒเป€เบ›เบฑเบ™เบญเบฑเบ™เบฎเบตเบšเบ”เปˆเบงเบ™

เบ›เบฐเบชเบปเบšเบเบฒเบ™เบ‚เบญเบ‡ "เบ›เบธเบ‡เบญเบฒเบซเบฒเบ™" Hadoop / Spark เบ—เบตเปˆเบกเบตเบšเบฒเบ”เปเบœเบเบฑเบšเบžเบฒเบเบชเปˆเบงเบ™เบ•เปˆเบฒเบ‡เป†เบ‚เบญเบ‡เบฎเปˆเบฒเบ‡เบเบฒเบเปเบกเปˆเบ™เบšเปเปˆเบกเบตเบ›เบฐเป‚เบซเบเบ”. เบ„เบงเบฒเบกเบ•เป‰เบญเบ‡เบเบฒเบ™เบ—เบตเปˆเบˆเบฐเบชเป‰เบฒเบ‡เบเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒเบ”เบฝเบง, เบฅเบฒเบ„เบฒเบšเปเปˆเปเบžเบ‡เปเบฅเบฐเป€เบŠเบทเปˆเบญเบ–เบทเป„เบ”เป‰เบ—เบตเปˆเบˆเบฐเบ—เบปเบ™เบ—เบฒเบ™เบ•เปเปˆเบ„เบงเบฒเบกเบฅเบปเป‰เบกเป€เบซเบผเบงเบ‚เบญเบ‡เบฎเบฒเบ”เปเบงเปเบฅเบฐเปƒเบ™เบ™เบฑเป‰เบ™เบกเบฑเบ™เป€เบ›เบฑเบ™เป„เบ›เป„เบ”เป‰เบ—เบตเปˆเบˆเบฐเป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒเปƒเบ™เบฎเบนเบšเปเบšเบšเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เบˆเบฒเบเบฅเบฐเบšเบปเบšเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เปเบฅเบฐเป€เบฎเบฑเบ”เปƒเบซเป‰เบ•เบปเบงเบขเปˆเบฒเบ‡เบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเปเบฅเบฐเปƒเบŠเป‰เป€เบงเบฅเบฒเบชเปเบฒเบฅเบฑเบšเบšเบปเบ”เบฅเบฒเบเบ‡เบฒเบ™เบˆเบฒเบเบ‚เปเป‰เบกเบนเบ™เบ™เบตเป‰เป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ—เบตเปˆเบˆเบฐ. เบ›เบฐเบเบปเบ”โ€‹เบ•เบปเบงโ€‹เบ‚เบถเป‰เบ™โ€‹เบขเปˆเบฒเบ‡โ€‹เบˆเบฐโ€‹เปเบˆเป‰เบ‡.

เบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเบเบฑเบ‡เบ•เป‰เบญเบ‡เบเบฒเบ™เบงเปˆเบฒเบเบฒเบ™เบญเบฑเบšเป€เบ”เบ”เบŠเบญเบšเปเบงเบ‚เบญเบ‡เป€เบงเบ—เบตเบ™เบตเป‰เบšเปเปˆเป„เบ”เป‰เป€เบฎเบฑเบ”เปƒเบซเป‰เบเบฑเบ™เบฎเป‰เบฒเบเบ‚เบญเบ‡เบ›เบตเปƒเบซเบกเปˆเบ”เป‰เบงเบเบเบฒเบ™เบญเปˆเบฒเบ™ 20 เบซเบ™เป‰เบฒ Java traces เปเบฅเบฐเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบšเบฑเบ™เบ—เบถเบเบฅเบฒเบเบฅเบฐเบญเบฝเบ”เบ„เบงเบฒเบกเบเบฒเบงเบเบดเป‚เบฅเปเบกเบฑเบ”เบ‚เบญเบ‡เบเบธเปˆเบกเป‚เบ”เบเปƒเบŠเป‰ Spark History Server เปเบฅเบฐเปเบเป‰เบงเบ‚เบฐเบซเบเบฒเบเบซเบฅเบฑเบ‡. เบ‚เป‰เบญเบเบขเบฒเบเบกเบตเป€เบ„เบทเปˆเบญเบ‡เบกเบทเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเป‚เบ›เปˆเบ‡เปƒเบชเบ—เบตเปˆเบšเปเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบเบฒเบ™เบ”เปเบฒเบ™เป‰เปเบฒเปเบšเบšเบ›เบปเบเบเบฐเบ•เบดเบžเบฒเบเปƒเบ•เป‰เบœเป‰เบฒเบญเบฑเบ”เบ”เบฑเบ‡เบ–เป‰เบฒเบ„เปเบฒเบฎเป‰เบญเบ‡เบ‚เป MapReduce เบกเบฒเบ”เบ•เบฐเบ–เบฒเบ™เบ‚เบญเบ‡เบœเบนเป‰เบžเบฑเบ”เบ—เบฐเบ™เบฒเบขเบธเบ”เป€เบŠเบปเบฒเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เปƒเบ™เป€เบงเบฅเบฒเบ—เบตเปˆเบžเบฐเบ™เบฑเบเบ‡เบฒเบ™เบ‚เปเป‰เบกเบนเบ™เบซเบผเบธเบ”เบฅเบปเบ‡เบˆเบฒเบเบซเบ™เปˆเบงเบเบ„เบงเบฒเบกเบˆเปเบฒเป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบงเบดเบ—เบตเบเบฒเบ™เปเบšเปˆเบ‡เบชเปˆเบงเบ™เบ‚เปเป‰เบกเบนเบ™เบ‚เบญเบ‡เปเบซเบผเปˆเบ‡เบ—เบตเปˆเป€เบฅเบทเบญเบเบšเปเปˆเป„เบ”เป‰เบ”เบตเบซเบผเบฒเบ.

Amazon S3 เป€เบ›เบฑเบ™เบœเบนเป‰เบชเบฐเบซเบกเบฑเบเบชเปเบฒเบฅเบฑเบš DataLake เบšเป?

เบ›เบฐเบชเบปเบšเบเบฒเบ™เบเบฑเบš Hadoop/MapReduce เป„เบ”เป‰เบชเบญเบ™เบžเบงเบเป€เบฎเบปเบฒเบงเปˆเบฒเบžเบงเบเป€เบฎเบปเบฒเบ•เป‰เบญเบ‡เบเบฒเบ™เบฅเบฐเบšเบปเบšเป„เบŸเบฅเปŒเบ—เบตเปˆเบชเบฒเบกเบฒเบ”เบ‚เบฐเบซเบเบฒเบเป„เบ”เป‰, เป€เบŠเบทเปˆเบญเบ–เบทเป„เบ”เป‰เปเบฅเบฐเบžเบฐเบ™เบฑเบเบ‡เบฒเบ™เบ—เบตเปˆเบชเบฒเบกเบฒเบ”เบ‚เบฐเบซเบเบฒเบเป„เบ”เป‰, "เป€เบ‚เบปเป‰เบฒเบกเบฒ" เปƒเบเป‰เบŠเบดเบ”เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เป€เบžเบทเปˆเบญเบšเปเปˆเปƒเบซเป‰เบ‚เปเป‰เบกเบนเบ™เบœเปˆเบฒเบ™เป€เบ„เบทเบญเบ‚เปˆเบฒเบ. เบœเบนเป‰เบญเบญเบเปเบฎเบ‡เบ‡เบฒเบ™เบ„เบงเบ™เบˆเบฐเบชเบฒเบกเบฒเบ”เบญเปˆเบฒเบ™เบ‚เปเป‰เบกเบนเบ™เปƒเบ™เบฎเบนเบšเปเบšเบšเบ•เปˆเบฒเบ‡เป†, เปเบ•เปˆเบ”เบตเบเบงเปˆเบฒเบšเปเปˆเบญเปˆเบฒเบ™เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เปเบฅเบฐเบชเบฒเบกเบฒเบ”เป€เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบฅเปˆเบงเบ‡เบซเบ™เป‰เบฒเปƒเบ™เบฎเบนเบšเปเบšเบšเบ—เบตเปˆเบชเบฐเบ”เบงเบเบชเปเบฒเบฅเบฑเบšเบœเบนเป‰เบญเบญเบเปเบฎเบ‡เบ‡เบฒเบ™.

เบญเบตเบเป€เบ—เบทเปˆเบญเบซเบ™เบถเปˆเบ‡, เปเบ™เบงเบ„เบงเบฒเบกเบ„เบดเบ”เบžเบทเป‰เบ™เบ–เบฒเบ™. เบšเปเปˆเบกเบตเบ„เบงเบฒเบกเบ›เบฒเบ–เบฐเบซเบ™เบฒเบ—เบตเปˆเบˆเบฐ "เบ–เบญเบ" เบ‚เปเป‰เบกเบนเบ™เปƒเบซเบเปˆเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบเบธเปˆเบกเบ”เบฝเบง, เป€เบŠเบดเปˆเบ‡เบˆเบฐเป„เบงเบซเบผเบทเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™ choke เปเบฅเบฐเบ—เปˆเบฒเบ™เบˆเบฐเบ•เป‰เบญเบ‡ shard เบกเบฑเบ™ ugly. เบ‚เป‰เบญเบเบ•เป‰เบญเบ‡เบเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒ, เบžเบฝเบ‡เปเบ•เปˆเป„เบŸเบฅเปŒ, เปƒเบ™เบฎเบนเบšเปเบšเบšเบ—เบตเปˆเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰เปเบฅเบฐเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบชเบญเบšเบ–เบฒเบกเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเปƒเบ™เบžเบงเบเบกเบฑเบ™เป‚เบ”เบเปƒเบŠเป‰เป€เบ„เบทเปˆเบญเบ‡เบกเบทเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เปเบ•เปˆเป€เบ‚เบปเป‰เบฒเปƒเบˆเป„เบ”เป‰. เปเบฅเบฐโ€‹เบˆเบฐโ€‹เบกเบตโ€‹เบซเบผเบฒเบโ€‹เปเบฅเบฐโ€‹เบซเบผเบฒเบโ€‹เป„เบŸเบฅโ€‹เปŒโ€‹เปƒเบ™โ€‹เบฎเบนเบšโ€‹เปเบšเบšโ€‹เบ—เบตเปˆโ€‹เปเบ•เบโ€‹เบ•เปˆเบฒเบ‡โ€‹เบเบฑเบ™โ€‹. เปเบฅเบฐเบกเบฑเบ™เบ”เบตเบเบงเปˆเบฒเบ—เบตเปˆเบˆเบฐ shard เบšเปเปˆเปเบกเปˆเบ™เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ, เปเบ•เปˆเบ‚เปเป‰เบกเบนเบ™เปเบซเบผเปˆเบ‡. เบžเบงเบเป€เบฎเบปเบฒเบ•เป‰เบญเบ‡เบเบฒเบ™ DataLake เบ—เบตเปˆเบชเบฒเบกเบฒเบ”เบ‚เบฐเบซเบเบฒเบเป„เบ”เป‰ เปเบฅเบฐเบ—เบปเปˆเบงเป„เบ›, เบžเบงเบเป€เบฎเบปเบฒเบ•เบฑเบ”เบชเบดเบ™เปƒเบˆ...

เบˆเบฐเป€เบ›เบฑเบ™เปเบ™เบงเปƒเบ”เบ–เป‰เบฒเบ—เปˆเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒเบขเบนเปˆเปƒเบ™เบšเปˆเบญเบ™เป€เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบŸเบฑเบ‡เบ—เบตเปˆเบ„เบธเป‰เบ™เป€เบ„เบตเบเปเบฅเบฐเบฎเบนเป‰เบˆเบฑเบเบเบฑเบ™เบ”เบตเบ—เบตเปˆ Amazon S3, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™เบเบฐเบเบฝเบกเบŸเบฑเบเบ‚เบญเบ‡เบ—เปˆเบฒเบ™เป€เบญเบ‡เบˆเบฒเบ Hadoop?

เบกเบฑเบ™เป€เบ›เบฑเบ™เบ—เบตเปˆเบŠเบฑเบ”เป€เบˆเบ™เบงเปˆเบฒเบ‚เปเป‰เบกเบนเบ™เบชเปˆเบงเบ™เบ•เบปเบงเปเบกเปˆเบ™ "เบ•เปเปˆเบฒ", เปเบ•เปˆเบ‚เปเป‰เบกเบนเบ™เบญเบทเปˆเบ™เปเบ™เบงเปƒเบ”เบ–เป‰เบฒเบžเบงเบเป€เบฎเบปเบฒเป€เบญเบปเบฒเบกเบฑเบ™เบญเบญเบเบˆเบฒเบเบšเปˆเบญเบ™เบ™เบฑเป‰เบ™เปเบฅเบฐ "เป€เบฎเบฑเบ”เปƒเบซเป‰เบกเบฑเบ™เบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบš"?

เบฅเบฐเบšเบปเบšเบ™เบดเป€เบงเบ” Cluster-bigdata-analytics เบ‚เบญเบ‡ Amazon Web Services - เปƒเบ™เบ„เปเบฒเบชเบฑเบšเบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเบซเบผเบฒเบ

เบเบฒเบ™เบ•เบฑเบ”เบชเบดเบ™เป‚เบ”เบเบ›เบฐเบชเบปเบšเบเบฒเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบเบฑเบš AWS, Apache Hadoop/MapReduce เป„เบ”เป‰เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เบขเปˆเบฒเบ‡เบˆเบดเบ‡เบˆเบฑเบ‡เบขเบนเปˆเบ—เบตเปˆเบ™เบฑเป‰เบ™เป€เบ›เบฑเบ™เป€เบงเบฅเบฒเบ”เบปเบ™เบ™เบฒเบ™เบžเบฒเบเปƒเบ•เป‰เบŠเบญเบ”เบ•เปˆเบฒเบ‡เป†, เบ•เบปเบงเบขเปˆเบฒเบ‡เปƒเบ™เบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™ DataPipeline (เบ‚เป‰เบญเบเบญเบดเบ”เบชเบฒเป€เบžเบทเปˆเบญเบ™เบฎเปˆเบงเบกเบ‡เบฒเบ™เบ‚เบญเบ‡เบ‚เป‰เบญเบ, เบžเบงเบเป€เบ‚เบปเบฒเป„เบ”เป‰เบฎเบฝเบ™เบฎเบนเป‰เบงเบดเบ—เบตเบเบฒเบ™เบเบฐเบเบฝเบกเบขเปˆเบฒเบ‡เบ–เบทเบเบ•เป‰เบญเบ‡). เบ—เบตเปˆเบ™เบตเป‰เบžเบงเบเป€เบฎเบปเบฒเบ•เบฑเป‰เบ‡เบ„เปˆเบฒเบเบฒเบ™เบชเปเบฒเบฎเบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™เบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เบˆเบฒเบเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ DynamoDB:
เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เปเบฅเบฐเป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒเป„เบ”เป‰เปเบฅเปˆเบ™เป€เบ›เบฑเบ™เบ›เบปเบเบเบฐเบ•เบดเบขเบนเปˆเปƒเบ™เบเบธเปˆเบก Hadoop/MapReduce เบ—เบตเปˆเบ–เบทเบเบเบฑเบ‡เป„เบงเป‰เบ„เบทเบเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบ‚เบญเบ‡เป‚เบกเบ‡เป€เบ›เบฑเบ™เป€เบงเบฅเบฒเบซเบผเบฒเบเบ›เบตเปเบฅเป‰เบง. "เบ•เบฑเป‰เบ‡เบกเบฑเบ™เปเบฅเบฐเบฅเบทเบกเบกเบฑเบ™":

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบ™เบญเบเบ™เบฑเป‰เบ™เบ—เปˆเบฒเบ™เบเบฑเบ‡เบชเบฒเบกเบฒเบ”เบกเบตเบชเปˆเบงเบ™เบฎเปˆเบงเบกเบขเปˆเบฒเบ‡เบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบ‚เบญเบ‡เบŠเบฒเบ•เบฒเบ™เบ‚เปเป‰เบกเบนเบ™เป‚เบ”เบเบเบฒเบ™เบ•เบฑเป‰เบ‡เปเบฅเบฑเบšเบ—เบฑเบญเบš Jupiter เบขเบนเปˆเปƒเบ™เบ„เบฅเบฒเบงเบชเปเบฒเบฅเบฑเบšเบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐเปเบฅเบฐเปƒเบŠเป‰เบšเปเบฅเบดเบเบฒเบ™ AWS SageMaker เป€เบžเบทเปˆเบญเบเบถเบเบญเบปเบšเบฎเบปเบกเปเบฅเบฐเบ™เปเบฒเปƒเบŠเป‰เบ•เบปเบงเปเบšเบš AI เป€เบ‚เบปเป‰เบฒเปƒเบ™เบเบฒเบ™เบชเบนเป‰เบฎเบปเบš. เบ™เบตเป‰เปเบกเปˆเบ™เบชเบดเปˆเบ‡เบ—เบตเปˆเบกเบฑเบ™เบ„เป‰เบฒเบเบ„เบทเบชเปเบฒเบฅเบฑเบšเบžเบงเบเป€เบฎเบปเบฒ:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เปเบฅเบฐเปเบกเปˆเบ™เปเบฅเป‰เบง, เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบญเบปเบฒเบ„เบญเบกเบžเบดเบงเป€เบ•เบตเป‚เบ™เบ”เบšเบธเบเบชเปเบฒเบฅเบฑเบšเบ•เบปเบงเบ—เปˆเบฒเบ™เป€เบญเบ‡เบซเบผเบทเบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐเปƒเบ™เป€เบกเบ„เปเบฅเบฐเบ•เบดเบ”เบกเบฑเบ™เปƒเบชเปˆเบเบฑเบšเบเบธเปˆเบก Hadoop / Spark, เป€เบฎเบฑเบ”เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เป€เบฅเบฑเบšเบ—เบธเบเบชเบดเปˆเบ‡เบ—เบธเบเบขเปˆเบฒเบ‡เบฅเบปเบ‡:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบชเบฐเบ”เบงเบเปเบ—เป‰เป†เบชเปเบฒเบฅเบฑเบšเป‚เบ„เบ‡เบเบฒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบชเปˆเบงเบ™เบšเบธเบเบ„เบปเบ™เปเบฅเบฐเบชเปเบฒเบฅเบฑเบšเบšเบฒเบ‡เบ„เบปเบ™เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบ™เปเบฒเปƒเบŠเป‰เบชเบปเบšเบœเบปเบ™เบชเปเบฒเป€เบฅเบฑเบ”เบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™ EMR เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเปเบฅเบฐเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆ. เบˆเบฐเป€เบ›เบฑเบ™เปเบ™เบงเปƒเบ”เบเปˆเบฝเบงเบเบฑเบšเบเบฒเบ™เปเบเป‰เป„เบ‚เบฅเบฐเบšเบปเบšเบชเปเบฒเบฅเบฑเบš DataLake, เบกเบฑเบ™เบˆเบฐเป€เบฎเบฑเบ”เบงเบฝเบเบšเป? เปƒเบ™เป€เบงเบฅเบฒเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบขเบนเปˆเปƒเบ™เบ‚เบญเบšเป€เบ‚เบ”เบ‚เบญเบ‡เบ„เบงเบฒเบกเบซเบงเบฑเบ‡เปเบฅเบฐเบ„เบงเบฒเบกเบชเบดเป‰เบ™เบซเบงเบฑเบ‡เปเบฅเบฐเบชเบทเบšเบ•เปเปˆเบ„เบปเป‰เบ™เบซเบฒ.

AWS Glue - เบซเบธเป‰เบกเบซเปเปˆ Apache Spark เบขเปˆเบฒเบ‡เป€เบ›เบฑเบ™เบฅเบฐเบšเบฝเบšเบเปˆเบฝเบงเบเบฑเบšเบชเบฐเป€เบ•เบตเบฃเบญเบ

เบกเบฑเบ™เป„เบ”เป‰เบซเบฑเบ™เบญเบญเบเบงเปˆเบฒ AWS เบกเบตเบฎเบธเปˆเบ™เบ‚เบญเบ‡เบ•เบปเบ™เป€เบญเบ‡เบ‚เบญเบ‡ "Hive / Pig / Spark" stack. เบšเบปเบ”เบšเบฒเบ”เบ‚เบญเบ‡ Hive, i.e. เบฅเบฒเบเบเบฒเบ™เป„เบŸเบฅเปŒ เปเบฅเบฐเบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡เบกเบฑเบ™เบขเบนเปˆเปƒเบ™ DataLake เปเบกเปˆเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เป‚เบ”เบเบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™ "เบฅเบฒเบเบเบฒเบ™เบ‚เปเป‰เบกเบนเบ™", เป€เบŠเบดเปˆเบ‡เบšเปเปˆเป„เบ”เป‰เป€เบŠเบทเปˆเบญเบ‡เบ„เบงเบฒเบกเป€เบ‚เบปเป‰เบฒเบเบฑเบ™เป„เบ”เป‰เบเบฑเบšเบฎเบนเบšเปเบšเบš Apache Hive. เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบžเบตเปˆเบกเบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆเบšเปเบฅเบดเบเบฒเบ™เบ™เบตเป‰เบเปˆเบฝเบงเบเบฑเบšเบšเปˆเบญเบ™เบ—เบตเปˆเป„เบŸเบฅเปŒเบ‚เบญเบ‡เบ—เปˆเบฒเบ™เบ•เบฑเป‰เบ‡เบขเบนเปˆเปเบฅเบฐเบขเบนเปˆเปƒเบ™เบฎเบนเบšเปเบšเบšเปƒเบ”. เบ‚เปเป‰เบกเบนเบ™เบชเบฒเบกเบฒเบ”เบšเปเปˆเบžเบฝเบ‡เปเบ•เปˆเบขเบนเปˆเปƒเบ™ s3, เปเบ•เปˆเบเบฑเบ‡เบขเบนเปˆเปƒเบ™เบ–เบฒเบ™เบ‚เปเป‰เบกเบนเบ™, เปเบ•เปˆเบ™เบฑเป‰เบ™เบšเปเปˆเปเบกเปˆเบ™เบซเบปเบงเบ‚เปเป‰เบ‚เบญเบ‡เบเบฒเบ™เบ•เบญเบšเบ™เบตเป‰. เบ™เบตเป‰เปเบกเปˆเบ™เบงเบดเบ—เบตเบเบฒเบ™เบˆเบฑเบ”เบฅเบฝเบ‡เบ‚เปเป‰เบกเบนเบ™ DataLake เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒ:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เป„เบŸเบฅเปŒเป„เบ”เป‰เบ–เบทเบเบฅเบปเบ‡เบ—เบฐเบšเบฝเบ™, เบ—เบตเปˆเบเบดเปˆเบ‡เปƒเบซเบเปˆ. เบ–เป‰เบฒเป„เบŸเบฅเปŒเป„เบ”เป‰เบ–เบทเบเบ›เบฑเบšเบ›เบธเบ‡, เบžเบงเบเป€เบฎเบปเบฒเป€เบ›เบตเบ”เบ•เบปเบงเบ•เบปเบงเบเบงเบฒเบ”เป€เบงเบฑเบšเบšเปเปˆเบงเปˆเบฒเบˆเบฐเบ”เป‰เบงเบเบ•เบปเบ™เป€เบญเบ‡เบซเบผเบทเปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡, เป€เบŠเบดเปˆเบ‡เบˆเบฐเบ›เบฑเบšเบ›เบธเบ‡เบ‚เปเป‰เบกเบนเบ™เบเปˆเบฝเบงเบเบฑเบšเบžเบงเบเบกเบฑเบ™เบˆเบฒเบเบ—เบฐเป€เบฅเบชเบฒเบšเปเบฅเบฐเบ›เบฐเบซเบเบฑเบ”เบžเบงเบเบกเบฑเบ™. เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™, เบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบ—เบฐเป€เบฅเบชเบฒเบšเบชเบฒเบกเบฒเบ”เบ–เบทเบเบ›เบธเบ‡เปเบ•เปˆเบ‡เปเบฅเบฐเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ—เบตเปˆเบ–เบทเบเบญเบฑเบšเป‚เบซเบฅเบ”เบขเบนเปˆเบšเปˆเบญเบ™เปƒเบ”เบซเบ™เบถเปˆเบ‡. เปƒเบ™เบเปเบฅเบฐเบ™เบตเบ‡เปˆเบฒเบเบ”เบฒเบเบ—เบตเปˆเบชเบธเบ”, เบžเบงเบเป€เบฎเบปเบฒเบเบฑเบ‡เบญเบฑเบšเป‚เบซเบฅเบ”เป„เบ›เบเบฑเบ‡ s3. เบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เบชเบฒเบกเบฒเบ”เป€เบฎเบฑเบ”เป„เบ”เป‰เบ—เบธเบเบšเปˆเบญเบ™, เปเบ•เปˆเปเบ™เบฐเบ™เปเบฒเปƒเบซเป‰เบ—เปˆเบฒเบ™เบ•เบฑเป‰เบ‡เบ„เปˆเบฒเบเบฒเบ™เบ›เบธเบ‡เปเบ•เปˆเบ‡เบขเบนเปˆเปƒเบ™เบเบธเปˆเบก Apache Spark เป‚เบ”เบเปƒเบŠเป‰เบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เบ‚เบฑเป‰เบ™เบชเบนเบ‡เบœเปˆเบฒเบ™ API AWS Glue. เปƒเบ™เบ„เบงเบฒเบกเป€เบ›เบฑเบ™เบˆเบดเบ‡, เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบญเบปเบฒเบฅเบฐเบซเบฑเบ” python เป€เบเบปเปˆเบฒเปเบฅเบฐเบ„เบธเป‰เบ™เป€เบ„เบตเบเบ—เบตเปˆเบ”เบตเป‚เบ”เบเปƒเบŠเป‰เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” pyspark เปเบฅเบฐเบเปเบฒเบ™เบปเบ”เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ‚เบญเบ‡เบกเบฑเบ™เบขเบนเปˆเปƒเบ™ N nodes เบ‚เบญเบ‡เบเบธเปˆเบกเบ—เบตเปˆเบกเบตเบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เปƒเบ™เบเบฒเบ™เบ•เบดเบ”เบ•เบฒเบก, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™เบ‚เบธเบ”เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™ guts เบ‚เบญเบ‡ Hadoop เปเบฅเบฐเบฅเบฒเบเบ•เบนเป‰เบ„เบญเบ™เป€เบ—เบ™เป€เบ™เบต docker-moker เปเบฅเบฐเบฅเบปเบšเบฅเป‰เบฒเบ‡เบ„เบงเบฒเบกเบ‚เบฑเบ”เปเบเป‰เบ‡เบเบฒเบ™เป€เบžเบดเปˆเบ‡เบžเบฒเบญเบฒเป„เบช. .

เบญเบตเบเป€เบ—เบทเปˆเบญ เปœเบถเปˆเบ‡, เบ„เบงเบฒเบกเบ„เบดเบ”เบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบ. เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡ configure Apache Spark, เบ—เปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบ‚เบฝเบ™เบฅเบฐเบซเบฑเบ” python เบชเปเบฒเบฅเบฑเบš pyspark, เบ—เบปเบ”เบชเบญเบšเบกเบฑเบ™เบขเบนเปˆเปƒเบ™เบ—เป‰เบญเบ‡เบ–เบดเปˆเบ™เปƒเบ™ desktop เบ‚เบญเบ‡เบ—เปˆเบฒเบ™เปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบ”เปเบฒเป€เบ™เบตเบ™เบเบฒเบ™เปƒเบ™เบเบธเปˆเบกเบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆเปƒเบ™เบ„เบฅเบฒเบง, เบเปเบฒเบ™เบปเบ”เบšเปˆเบญเบ™เบ—เบตเปˆเบ‚เปเป‰เบกเบนเบ™เปเบซเบผเปˆเบ‡เปเบฅเบฐเบšเปˆเบญเบ™เบ—เบตเปˆเบˆเบฐเป€เบญเบปเบฒเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบš. เบšเบฒเบ‡เบ„เบฑเป‰เบ‡เบ™เบตเป‰เปเบกเปˆเบ™เบกเบตเบ„เบงเบฒเบกเบˆเปเบฒเป€เบ›เบฑเบ™เปเบฅเบฐเป€เบ›เบฑเบ™เบ›เบฐเป‚เบซเบเบ”, เปเบฅเบฐเบ™เบตเป‰เปเบกเปˆเบ™เบงเบดเบ—เบตเบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบ•เบฑเป‰เบ‡เบ„เปˆเบฒเบกเบฑเบ™:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เปƒเบ™เบเบธเปˆเบก Spark เป‚เบ”เบเปƒเบŠเป‰เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ s3, เบžเบงเบเป€เบฎเบปเบฒเบ‚เบฝเบ™เบฅเบฐเบซเบฑเบ”เปƒเบ™ python / pyspark, เบ—เบปเบ”เบชเบญเบšเบกเบฑเบ™, เปเบฅเบฐเป‚เบŠเบเบ”เบตเบเบฑเบšเบŸเบฑเบ‡.

เบˆเบฐเป€เบ›เบฑเบ™เปเบ™เบงเปƒเบ”เบเปˆเบฝเบงเบเบฑเบšเบเบฒเบ™ orchestration? เบˆเบฐเป€เบ›เบฑเบ™เปเบ™เบงเปƒเบ”เบ–เป‰เบฒเบงเบฝเบเบ‡เบฒเบ™เบซเบผเบธเบ”เบฅเบปเบ‡เปเบฅเบฐเบซเบฒเบเป„เบ›? เปเบกเปˆเบ™เปเบฅเป‰เบง, เบกเบฑเบ™เป„เบ”เป‰เบ–เบทเบเบชเบฐเป€เบซเบ™เบตเปƒเบซเป‰เบชเป‰เบฒเบ‡เบ—เปเปˆเบ—เบตเปˆเบชเบงเบเบ‡เบฒเบกเปƒเบ™เบฎเบนเบšเปเบšเบš Apache Pig เปเบฅเบฐเบžเบงเบเป€เบฎเบปเบฒเบเปเปˆเบžเบฐเบเบฒเบเบฒเบกเบžเบงเบเบกเบฑเบ™, เปเบ•เปˆเบชเปเบฒเบฅเบฑเบšเบ•เบญเบ™เบ™เบตเป‰เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบ•เบฑเบ”เบชเบดเบ™เปƒเบˆเบ—เบตเปˆเบˆเบฐเปƒเบŠเป‰ orchestration เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบขเปˆเบฒเบ‡เป€เบฅเบดเบเป€เบŠเบดเปˆเบ‡เปƒเบ™ PHP เปเบฅเบฐ JavaScript (เบ‚เป‰เบญเบเป€เบ‚เบปเป‰เบฒเปƒเบˆ, เบกเบฑเบ™เบกเบตเบชเบฐเบ•เบดเบ›เบฑเบ™เบเบฒ, เปเบ•เปˆเบกเบฑเบ™เป€เบฎเบฑเบ”เบงเบฝเบ, เบชเปเบฒเบฅเบฑเบš. เบ›เบตโ€‹เปเบฅเบฐโ€‹เบšเปเปˆโ€‹เบกเบตโ€‹เบ„เบงเบฒเบกโ€‹เบœเบดเบ”โ€‹เบžเบฒเบ”โ€‹)โ€‹.

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบฎเบนเบšเปเบšเบšเบ‚เบญเบ‡เป„เบŸเบฅเปŒเบ—เบตเปˆเป€เบเบฑเบšเป„เบงเป‰เปƒเบ™เบ—เบฐเป€เบฅเบชเบฒเบšเปเบกเปˆเบ™เบเบธเบ™เปเบˆเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”

เบกเบฑเบ™เป€เบ›เบฑเบ™เบชเบดเปˆเบ‡ เบชเบณ เบ„เบฑเบ™เบซเบผเบฒเบเบ—เบตเปˆเบˆเบฐเป€เบ‚เบปเป‰เบฒเปƒเบˆเบชเบญเบ‡เบˆเบธเบ” เบชเบณ เบ„เบฑเบ™เบซเบผเบฒเบ. เป€เบžเบทเปˆเบญเปƒเบซเป‰เบเบฒเบ™เบชเบญเบšเบ–เบฒเบกเบเปˆเบฝเบงเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เป„เบŸเบฅเปŒเปƒเบ™เบ—เบฐเป€เบฅเบชเบฒเบšเบ–เบทเบเบ›เบฐเบ•เบดเบšเบฑเบ”เป„เบงเป€เบ—เบปเปˆเบฒเบ—เบตเปˆเบˆเบฐเป„เบงเป„เบ”เป‰เปเบฅเบฐเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบšเปเปˆเปƒเบซเป‰เบซเบผเบธเบ”เบซเบ™เป‰เบญเบเบฅเบปเบ‡เป€เบกเบทเปˆเบญเบ‚เปเป‰เบกเบนเบ™เปƒเบซเบกเปˆเบ–เบทเบเป€เบžเบตเปˆเบก, เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡:

  • เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเบ„เปเบฅเปเบฒเบ‚เบญเบ‡เป„เบŸเบฅเปŒเปเบเบเบ•เปˆเบฒเบ‡เบซเบฒเบ (เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบ—เปˆเบฒเบ™เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบญเปˆเบฒเบ™เบ—เบธเบเปเบ–เบงเป€เบžเบทเปˆเบญเป€เบ‚เบปเป‰เบฒเปƒเบˆเบชเบดเปˆเบ‡เบ—เบตเปˆเบขเบนเปˆเปƒเบ™เบ„เปเบฅเปเบฒ). เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ™เบตเป‰เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เป€เบญเบปเบฒเบฎเบนเบšเปเบšเบš parquet เบ”เป‰เบงเบเบเบฒเบ™เบšเบตเบšเบญเบฑเบ”
  • เบกเบฑเบ™เป€เบ›เบฑเบ™เบชเบดเปˆเบ‡เบชเปเบฒเบ„เบฑเบ™เบซเบผเบฒเบเบ—เบตเปˆเบˆเบฐ shard เป„เบŸเบฅเปŒเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เป‚เบŸเบ™เป€เบ”เบตเป€เบŠเบฑเปˆเบ™: เบžเบฒเบชเบฒ, เบ›เบต, เป€เบ”เบทเบญเบ™, เบกเบทเป‰, เบญเบฒเบ—เบดเบ”. เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบ—เบตเปˆเป€เบ‚เบปเป‰เบฒเปƒเบˆเบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡ sharding เบ™เบตเป‰เบˆเบฐเป€เบšเบดเปˆเบ‡เบžเบฝเบ‡เปเบ•เปˆเบขเบนเปˆเปƒเบ™เป‚เบŸเบ™เป€เบ”เบตเบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™ sifting เบœเปˆเบฒเบ™เบ‚เปเป‰เบกเบนเบ™เบ—เบฑเบ‡เบซเบกเบปเบ”เบ•เบดเบ”เบ•เปเปˆเบเบฑเบ™.

เป‚เบ”เบเบžเบทเป‰เบ™เบ–เบฒเบ™เปเบฅเป‰เบง, เปƒเบ™เบ—เบฒเบ‡เบ™เบตเป‰, เป€เบˆเบปเป‰เบฒเบˆเบฑเบ”เบงเบฒเบ‡เบ‚เปเป‰เบกเบนเบ™เปเบซเบผเปˆเบ‡เปƒเบ™เบฎเบนเบšเปเบšเบšเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบ—เบตเปˆเบชเบธเบ”เบชเปเบฒเบฅเบฑเบšเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบงเบฒเบ‡เป„เบงเป‰เป€เบ—เบดเบ‡, เป€เบŠเบดเปˆเบ‡เป€เบ–เบดเบ‡เปเบกเปˆเบ™เบงเปˆเบฒเบขเบนเปˆเปƒเบ™เป‚เบŸเป€เบ”เบต sharded เบชเบฒเบกเบฒเบ”เป€เบฅเบทเบญเบเป€เบ‚เบปเป‰เบฒเปเบฅเบฐเบญเปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ„เปเบฅเปเบฒเบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบˆเบฒเบเป„เบŸเบฅเปŒ. เบ—เปˆเบฒเบ™เบšเปเปˆ เบˆเบณ เป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡ "เบ•เบทเปˆเบก" เบ‚เปเป‰เบกเบนเบ™เบขเบนเปˆเบšเปˆเบญเบ™เปƒเบ”เบšเปˆเบญเบ™ เปœเบถเปˆเบ‡ (เบšเปˆเบญเบ™เป€เบเบฑเบšเบกเป‰เบฝเบ™เบˆเบฐเปเบ•เบเบญเบญเบเบกเบฒ) - เบžเบฝเบ‡เปเบ•เปˆเป€เบญเบปเบฒเบกเบฑเบ™เป„เบงเป‰เปƒเบ™เบฅเบฐเบšเบปเบšเป€เบญเบเบฐเบชเบฒเบ™เปƒเบ™เบฎเบนเบšเปเบšเบšเบ—เบตเปˆเบ–เบทเบเบ•เป‰เบญเบ‡. เปเบ™เปˆเบ™เบญเบ™, เบกเบฑเบ™เบ„เบงเบ™เบˆเบฐเบˆเบฐเปเบˆเป‰เบ‡เบขเบนเปˆเบ—เบตเปˆเบ™เบตเป‰เบงเปˆเบฒเบเบฒเบ™เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเป„เบŸเบฅเปŒ csv เบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆเปƒเบ™ DataLake, เป€เบŠเบดเปˆเบ‡เบ—เปเบฒเบญเบดเบ”เบ•เป‰เบญเบ‡เป„เบ”เป‰เบฎเบฑเบšเบเบฒเบ™เบญเปˆเบฒเบ™เปเบ–เบงเป‚เบ”เบเบเบธเปˆเบกเป€เบžเบทเปˆเบญเบชเบฐเบเบฑเบ”เบ„เปเบฅเปเบฒ, เบšเปเปˆเปเบกเปˆเบ™เบเบฒเบ™เปเบ™เบฐเบ™เปเบฒเบซเบผเบฒเบ. เบ„เบดเบ”เบเปˆเบฝเบงเบเบฑเบšเบชเบญเบ‡เบˆเบธเบ”เบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡เบ™เบตเป‰เบญเบตเบเป€เบ—เบทเปˆเบญเบซเบ™เบถเปˆเบ‡เบ–เป‰เบฒเบซเบฒเบเบงเปˆเบฒเบกเบฑเบ™เบเบฑเบ‡เบšเปเปˆเบ—เบฑเบ™เบˆเบฐเปเบˆเป‰เบ‡เบงเปˆเบฒเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”เบ™เบตเป‰เป€เบเบตเบ”เบ‚เบถเป‰เบ™.

AWS Athena - jack-in-the-box

เปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™, เปƒเบ™เบ‚เบฐเบ™เบฐเบ—เบตเปˆเบชเป‰เบฒเบ‡เบ—เบฐเป€เบฅเบชเบฒเบš, เบžเบงเบเป€เบฎเบปเบฒเบšเบฑเบ‡เป€เบญเบตเบ™เบกเบฒเปƒเบ™เบ—เบปเปˆเบง Amazon Athena. เบ—เบฑเบ™เปƒเบ”เบ™เบฑเป‰เบ™เบกเบฑเบ™เป„เบ”เป‰เบซเบฑเบ™เบญเบญเบเบงเปˆเบฒเป‚เบ”เบเบเบฒเบ™เบˆเบฑเบ”เบฅเบฝเบ‡เป„เบŸเบฅเปŒเบšเบฑเบ™เบ—เบถเบเบ‚เบฐเบซเบ™เบฒเบ”เปƒเบซเบเปˆเบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™ shards เป‚เบŸเป€เบ”เบตเปƒเบ™เบฎเบนเบšเปเบšเบšเบ–เบฑเบ™เบ—เบตเปˆเบ–เบทเบเบ•เป‰เบญเบ‡ (parquet), เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบฅเบทเบญเบเบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบžเบงเบเบกเบฑเบ™เป„เบ”เป‰เบขเปˆเบฒเบ‡เป„เบงเบงเบฒเปเบฅเบฐเบชเป‰เบฒเบ‡เบšเบปเบ”เบฅเบฒเบเบ‡เบฒเบ™เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบธเปˆเบก Apache Spark / Glue.

เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ Athena เบ‚เบฑเบšเป€เบ„เบทเปˆเบญเบ™เป‚เบ”เบเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ s3 เปเบกเปˆเบ™เบญเบตเบ‡เปƒเบชเปˆเบ„เบงเบฒเบกเบซเบกเบฒเบ Presto - เบ•เบปเบงโ€‹เปเบ—เบ™โ€‹เบ‚เบญเบ‡ MPP (เบเบฒเบ™โ€‹เบ›เบธเบ‡โ€‹เปเบ•เปˆเบ‡โ€‹เบ‚เบฐโ€‹เบซเบ™เบฒเบ™โ€‹เบ‚เบฐโ€‹เบซเบ™เบฒเบ”โ€‹เปƒเบซเบเปˆโ€‹) เบ„เบญเบšโ€‹เบ„เบปเบงโ€‹เบ‚เบญเบ‡โ€‹เบงเบดโ€‹เบ—เบตโ€‹เบเบฒเบ™โ€‹เบชเปเบฒโ€‹เบฅเบฑเบšโ€‹เบเบฒเบ™โ€‹เบ›เบฐโ€‹เบกเบงเบ™โ€‹เบœเบปเบ™โ€‹เบ‚เปเป‰โ€‹เบกเบนเบ™โ€‹, เบเบฒเบ™โ€‹เป€เบญเบปเบฒโ€‹เบ‚เปเป‰โ€‹เบกเบนเบ™โ€‹เบ—เบตเปˆโ€‹เบกเบฑเบ™โ€‹เบขเบนเปˆโ€‹, เบˆเบฒเบ s3 เปเบฅเบฐ Hadoop เบเบฑเบš Cassandra เปเบฅเบฐโ€‹เป„เบŸเบฅโ€‹เปŒโ€‹เบ‚เปเป‰โ€‹เบ„เบงเบฒเบกโ€‹เบ›เบฐโ€‹เบŠเบธเบกโ€‹เบชเบฐโ€‹เป„เบซเบกโ€‹. เบ—เปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบ‚เปเปƒเบซเป‰ Athena เบ”เปเบฒเป€เบ™เบตเบ™เบเบฒเบ™เบชเบญเบšเบ–เบฒเบก SQL, เปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบ—เบธเบเบชเบดเปˆเบ‡เบ—เบธเบเบขเปˆเบฒเบ‡ "เป€เบฎเบฑเบ”เบงเบฝเบเบขเปˆเบฒเบ‡เป„เบงเบงเบฒเปเบฅเบฐเบญเบฑเบ”เบ•เบฐเป‚เบ™เบกเบฑเบ”." เบกเบฑเบ™เป€เบ›เบฑเบ™เบชเบดเปˆเบ‡เบชเปเบฒเบ„เบฑเบ™เบ—เบตเปˆเบˆเบฐเบชเบฑเบ‡เป€เบเบ”เบงเปˆเบฒ Athena เปเบกเปˆเบ™ "เบชเบฐเบซเบผเบฒเบ”", เบกเบฑเบ™เบžเบฝเบ‡เปเบ•เปˆเป„เบ›เบซเบฒเป‚เบŸเป€เบ”เบต sharded เบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เปเบฅเบฐเบญเปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ„เปเบฅเปเบฒเบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เปƒเบ™เบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เป.

เบฅเบฒเบ„เบฒเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เปเบเบฑเบš Athena เปเบกเปˆเบ™เบซเบ™เป‰เบฒเบชเบปเบ™เปƒเบˆ. เบžเบงเบเป€เบฎเบปเบฒเบˆเปˆเบฒเบเบชเปเบฒเบฅเบฑเบš เบ›เบฐเบฅเบดเบกเบฒเบ™เบ‚เบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบชเบฐเปเบเบ™. เป€เบซเบผเบปเปˆเบฒเบ™เบฑเป‰เบ™. เบšเปเปˆเปเบกเปˆเบ™เบชเปเบฒเบฅเบฑเบšเบˆเปเบฒเบ™เบงเบ™เบ‚เบญเบ‡เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเปƒเบ™ cluster เบ•เปเปˆเบ™เบฒเบ—เบต, เปเบ•เปˆ ... เบชเปเบฒเบฅเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบ•เบปเบงเบˆเบดเบ‡ scanned เปƒเบ™ 100-500 เป€เบ„เบทเปˆเบญเบ‡, เบžเบฝเบ‡เปเบ•เปˆเบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เบชเปเบฒเป€เบฅเบฑเบ”เบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เป.

เปเบฅเบฐเป‚เบ”เบเบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เปเบžเบฝเบ‡เปเบ•เปˆเบ„เปเบฅเปเบฒเบ—เบตเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบˆเบฒเบเป‚เบŸเบ™เป€เบ”เบต sharded เบขเปˆเบฒเบ‡เบ–เบทเบเบ•เป‰เบญเบ‡, เบกเบฑเบ™เป„เบ”เป‰เบซเบฑเบ™เบญเบญเบเบงเปˆเบฒเบเบฒเบ™เบšเปเบฅเบดเบเบฒเบ™ Athena เบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบซเบผเบฒเบเบชเบดเบšเป‚เบ”เบฅเบฒเบ•เปเปˆเป€เบ”เบทเบญเบ™. เบ”เบตเบซเบผเบฒเบ, เป€เบเบทเบญเบšเบšเปเปˆเป€เบชเบเบ„เปˆเบฒ, เป€เบกเบทเปˆเบญเบ›เบฝเบšเบ—เบฝเบšเบเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเปƒเบ™เบเบธเปˆเบก!

เป‚เบ”เบเบงเบดเบ—เบตเบ—เบฒเบ‡เบเบฒเบ™, เบ™เบตเป‰เปเบกเปˆเบ™เบงเบดเบ—เบตเบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเปเบšเปˆเบ‡เบ›เบฑเบ™เบ‚เปเป‰เบกเบนเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเปƒเบ™ s3:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เปƒเบ™เป€เบงเบฅเบฒเบชเบฑเป‰เบ™เป†, เบžเบฐเปเบ™เบเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”, เบˆเบฒเบเบ„เบงเบฒเบกเบ›เบญเบ”เป„เบžเบ‚เบญเบ‡เบ‚เปเป‰เบกเบนเบ™เป„เบ›เบซเบฒเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐ, เป„เบ”เป‰เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เปเบขเปˆเบฒเบ‡เบˆเบดเบ‡เบˆเบฑเบ‡เบเบฑเบš Athena เปเบฅเบฐเบขเปˆเบฒเบ‡เป„เบงเบงเบฒ, เปƒเบ™เบงเบดเบ™เบฒเบ—เบต, เป„เบ”เป‰เบฎเบฑเบšเบ„เปเบฒเบ•เบญเบšเบ—เบตเปˆเป€เบ›เบฑเบ™เบ›เบฐเป‚เบซเบเบ”เบˆเบฒเบเบ‚เปเป‰เบกเบนเบ™ "เปƒเบซเบเปˆ" เปƒเบ™เป„เบฅเบเบฐเป€เบงเบฅเบฒเบซเบผเบฒเบ: เป€เบ”เบทเบญเบ™, เป€เบ„เบดเปˆเบ‡เบ›เบต, เปเบฅเบฐเบญเบทเปˆเบ™เป† P.

เปเบ•เปˆโ€‹เบžเบงเบโ€‹เป€เบฎเบปเบฒโ€‹เป„เบ”เป‰โ€‹เป„เบ›โ€‹เบ•เบทเปˆเบกโ€‹เบญเบตเบโ€‹เปเบฅเบฐโ€‹เป„เบ”เป‰โ€‹เป€เบฅเบตเปˆเบกโ€‹เบ•เบปเป‰เบ™โ€‹เบ—เบตเปˆโ€‹เบˆเบฐโ€‹เป„เบ›โ€‹เบŸเบฑเบ‡โ€‹เบชเปเบฒโ€‹เบฅเบฑเบšโ€‹เบ„เปเบฒโ€‹เบ•เบญเบšโ€‹ เบœเปˆเบฒเบ™เป„เบ”เป€เบงเบต ODBC: เบ™เบฑเบเบงเบดเป€เบ„เบฒเบฐเบ‚เบฝเบ™เบ„เปเบฒเบ–เบฒเบก SQL เปƒเบ™ console เบ—เบตเปˆเบ„เบธเป‰เบ™เป€เบ„เบตเบ, เป€เบŠเบดเปˆเบ‡เปƒเบ™ 100-500 เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ "เบชเปเบฒเบฅเบฑเบš pennies" เบชเบปเปˆเบ‡เบ‚เปเป‰เบกเบนเบ™เป„เบ›เบซเบฒ s3 เปเบฅเบฐเบ•เบญเบšเบ„เปเบฒเบ•เบญเบšเป‚เบ”เบเบ›เบปเบเบเบฐเบ•เบดเปƒเบ™เบชเบญเบ‡เบชเบฒเบกเบงเบดเบ™เบฒเบ—เบต. เบชเบฐเบ”เบงเบเบชเบฐเบšเบฒเบ. เปเบฅเบฐเป„เบง. เบ‚เป‰เบญเบเบเบฑเบ‡เบšเปเปˆเบชเบฒเบกเบฒเบ”เป€เบŠเบทเปˆเบญเบกเบฑเบ™เป„เบ”เป‰.

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เป„เบ”เป‰เบ•เบฑเบ”เบชเบดเบ™เปƒเบˆเป€เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ s3, เปƒเบ™เบฎเบนเบšเปเบšเบšเบ„เปเบฅเปเบฒเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเปเบฅเบฐเบกเบตเบเบฒเบ™เปเบšเปˆเบ‡เบ›เบฑเบ™เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบชเบปเบกเป€เบซเบ”เบชเบปเบกเบœเบปเบ™เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เป‚เบŸเบ™เป€เบ”เบต ... เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบฎเบฑเบš DataLake เปเบฅเบฐเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเป„เบงเปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบ - เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบŸเบฃเบต. เปเบฅเบฐเบฅเบฒเบงเป„เบ”เป‰เบเบฒเบเป€เบ›เบฑเบ™เบ—เบตเปˆเบ™เบดเบเบปเบกเบซเบผเบฒเบเปƒเบ™เบšเปเบฅเบดเบชเบฑเบ”, เป€เบžเบฒเบฐเบงเปˆเบฒ ... เป€เบ‚เบปเป‰เบฒโ€‹เปƒเบˆ SQL เปเบฅเบฐโ€‹เป€เบฎเบฑเบ”โ€‹เบงเบฝเบโ€‹เบ„เปเบฒโ€‹เบชเบฑเปˆเบ‡โ€‹เบ‚เบฐโ€‹เบซเบ™เบฒเบ”โ€‹เป„เบงโ€‹เบโ€‹เปˆโ€‹เบงเบฒโ€‹เป‚เบ”เบโ€‹เบœเปˆเบฒเบ™โ€‹เบเบฒเบ™โ€‹เป€เบฅเบตเปˆเบกโ€‹เบ•เบปเป‰เบ™ / เบขเบธเบ” / เบเบฒเบ™โ€‹เบ•เบฑเป‰เบ‡โ€‹เบ„เปˆเบฒโ€‹เบเบธเปˆเบกโ€‹. "เปเบฅเบฐเบ–เป‰เบฒเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ„เบทเบเบฑเบ™, เป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ•เป‰เบญเบ‡เบˆเปˆเบฒเบเบซเบผเบฒเบ?"

เบเบฒเบ™เบฎเป‰เบญเบ‡เบ‚เปเบ•เปเปˆ Athena เป€เบšเบดเปˆเบ‡เบ„เบทเบงเปˆเบฒเป€เบ›เบฑเบ™เปเบšเบšเบ™เบตเป‰. เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™, เปเบ™เปˆเบ™เบญเบ™, เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ›เบฐเบเบญเบšเบžเบฝเบ‡เบžเป เบเบฒเบ™เบชเบญเบšเบ–เบฒเบก SQL เบ—เบตเปˆเบชเบฑเบšเบชเบปเบ™ เปเบฅเบฐเบซเบผเบฒเบเปœเป‰เบฒ, เปเบ•เปˆเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบˆเปเบฒเบเบฑเบ”เบ•เบปเบงเป€เบญเบ‡เปƒเบ™เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบšเบšเบ‡เปˆเบฒเบเบ”เบฒเบ. เปƒเบซเป‰เป€เบšเบดเปˆเบ‡เบงเปˆเบฒเบฅเบฐเบซเบฑเบ”เบ•เบญเบšเบชเบฐเบซเบ™เบญเบ‡เปƒเบ”เบ—เบตเปˆเบฅเบนเบเบ„เป‰เบฒเบกเบตเบชเบญเบ‡เบชเบฒเบกเบญเบฒเบ—เบดเบ”เบเปˆเบญเบ™เบซเบ™เป‰เบฒเบ™เบตเป‰เปƒเบ™เบšเบฑเบ™เบ—เบถเบเบ‚เบญเบ‡เป€เบ„เบทเปˆเบญเบ‡เปเบกเปˆเบ‚เปˆเบฒเบเป€เบงเบฑเบšเปเบฅเบฐเปƒเบซเป‰เปเบ™เปˆเปƒเบˆเบงเปˆเบฒเบšเปเปˆเบกเบตเบ‚เปเป‰เบœเบดเบ”เบžเบฒเบ”:

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฑเบ”เบ•เบฑเป‰เบ‡ DataLake เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเบชเบนเบ‡ เปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเปเบ™เบงเปƒเบ” เปเบฅเบฐเป€เบ›เบฑเบ™เบซเบเบฑเบ‡เบ„เบทเปเบ™เบงเบ™เบตเป‰

เบเบฒเบ™เบ„เบปเป‰เบ™เบžเบปเบš

เป‚เบ”เบเป„เบ”เป‰เบœเปˆเบฒเบ™, เบšเปเปˆเป„เบ”เป‰เป€เบงเบปเป‰เบฒเป€เบชเบฑเป‰เบ™เบ—เบฒเบ‡เบ—เบตเปˆเบเบฒเบง, เปเบ•เปˆเป€เบˆเบฑเบšเบ›เบงเบ”, เบเบฒเบ™เบ›เบฐเป€เบกเบตเบ™เบ„เบงเบฒเบกเบชเปˆเบฝเบ‡เปเบฅเบฐเบฅเบฐเบ”เบฑเบšเบ„เบงเบฒเบกเบŠเบฑเบšเบŠเป‰เบญเบ™เปเบฅเบฐเบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบขเปˆเบฒเบ‡เบ•เปเปˆเป€เบ™เบทเปˆเบญเบ‡เบขเปˆเบฒเบ‡เบžเบฝเบ‡เบžเป, เบžเบงเบเป€เบฎเบปเบฒเบžเบปเบšเป€เบซเบฑเบ™เบเบฒเบ™เปเบเป‰เป„เบ‚เบชเปเบฒเบฅเบฑเบš DataLake เปเบฅเบฐเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ—เบตเปˆเบšเปเปˆเป€เบ„เบตเบเบขเบธเบ”เป€เบŠเบปเบฒเบ—เบตเปˆเบˆเบฐเบเบฐเบฅเบธเบ™เบฒเบžเบงเบเป€เบฎเบปเบฒเบ”เป‰เบงเบเบ„เบงเบฒเบกเป„เบงเปเบฅเบฐเบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเปƒเบ™เบเบฒเบ™เป€เบ›เบฑเบ™เป€เบˆเบปเป‰เบฒเบ‚เบญเบ‡.

เบกเบฑเบ™เป„เบ”เป‰เบซเบฑเบ™เบญเบญเบเบงเปˆเบฒเบเบฒเบ™เบเปเปˆเบชเป‰เบฒเบ‡เบ—เบตเปˆเบกเบตเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบš, เป„เบงเปเบฅเบฐเบฅเบฒเบ„เบฒเบ–เบทเบเป€เบžเบทเปˆเบญเบ”เปเบฒเป€เบ™เบตเบ™เบเบฒเบ™ DataLake เบชเปเบฒเบฅเบฑเบšเบ„เบงเบฒเบกเบ•เป‰เบญเบ‡เบเบฒเบ™เบ‚เบญเบ‡เบžเบฐเปเบ™เบเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เบ‚เบญเบ‡เบšเปเบฅเบดเบชเบฑเบ”เปเบกเปˆเบ™เบชเบปเบกเบšเบนเบ™เปƒเบ™เบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เบ‚เบญเบ‡เบ™เบฑเบเบžเบฑเบ”เบ—เบฐเบ™เบฒเบ—เบตเปˆเบกเบตเบ›เบฐเบชเบปเบšเบเบฒเบ™เบ—เบตเปˆเบšเปเปˆเป€เบ„เบตเบเป€เบฎเบฑเบ”เบงเบฝเบเป€เบ›เบฑเบ™เบชเบฐเบ–เบฒเบ›เบฐเบ™เบดเบเปเบฅเบฐเบšเปเปˆเบฎเบนเป‰เบงเบดเบ—เบตเบเบฒเบ™เปเบ•เป‰เบกเบฎเบนเบšเบชเบตเปˆเบซเบผเปˆเบฝเบกเบกเบปเบ™. เบฅเบนเบเบชเบญเบ™เปเบฅเบฐเบฎเบนเป‰ 50 เบ‚เปเป‰เบเปเบฒเบ™เบปเบ”เบˆเบฒเบเบฅเบฐเบšเบปเบšเบ™เบดเป€เบงเบ” Hadoop.

เปƒเบ™เบ•เบญเบ™เป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ‚เบญเบ‡เบเบฒเบ™เป€เบ”เบตเบ™เบ—เบฒเบ‡, เบซเบปเบงเบ‚เบญเบ‡เบ‚เป‰เบญเบเป„เบ”เป‰เปเบเบเบญเบญเบเบˆเบฒเบเบชเบงเบ™เบชเบฑเบ”เบ›เปˆเบฒเบ—เปเบฒเบกเบฐเบŠเบฒเบ”เบˆเปเบฒเบ™เบงเบ™เบซเบผเบฒเบเบ‚เบญเบ‡เบŠเบญเบšเปเบงเป€เบ›เบตเบ”เปเบฅเบฐเบ›เบดเบ”เปเบฅเบฐเบ„เบงเบฒเบกเป€เบ‚เบปเป‰เบฒเปƒเบˆเบ‚เบญเบ‡เบžเบฒเบฅเบฐเบ‚เบญเบ‡เบ„เบงเบฒเบกเบฎเบฑเบšเบœเบดเบ”เบŠเบญเบšเบ•เปเปˆเบฅเบนเบเบซเบฅเบฒเบ™. เบžเบฝเบ‡เปเบ•เปˆเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบชเป‰เบฒเบ‡ DataLake เบ‚เบญเบ‡เบ—เปˆเบฒเบ™เบˆเบฒเบเป€เบ„เบทเปˆเบญเบ‡เบกเบทเบ‡เปˆเบฒเบเป†: nagios/munin -> elastic/kibana -> Hadoop/Spark/s3..., เป€เบเบฑเบšเบเปเบฒเบ‚เปเป‰เบ„เบดเบ”เป€เบซเบฑเบ™เปเบฅเบฐเบ„เบงเบฒเบกเป€เบ‚เบปเป‰เบฒเปƒเบˆเบขเปˆเบฒเบ‡เป€เบฅเบดเบเป€เบŠเบดเปˆเบ‡เบเปˆเบฝเบงเบเบฑเบšเบŸเบตเบŠเบดเบเบ‚เบญเบ‡เบ‚เบฐเบšเบงเบ™เบเบฒเบ™เบ—เบตเปˆเป€เบเบตเบ”เบ‚เบถเป‰เบ™. เบ—เบธเบโ€‹เบชเบดเปˆเบ‡โ€‹เบ—เบธเบโ€‹เบขเปˆเบฒเบ‡โ€‹เบชเบฐโ€‹เบฅเบฑเบšโ€‹เบชเบฑเบšโ€‹เบŠเป‰เบญเบ™โ€‹เปเบฅเบฐ murky - เปƒเบซเป‰โ€‹เบกเบฑเบ™โ€‹เบเบฑเบšโ€‹เบชเบฑเบ”โ€‹เบ•เบนโ€‹เปเบฅเบฐโ€‹เบ„เบนเปˆโ€‹เปเบ‚เปˆเบ‡โ€‹.

เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบšเปเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เป„เบ›เบŸเบฑเบ‡เบ„เบฅเบฒเบงเปเบฅเบฐเบกเบฑเบเบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™, เบ›เบฑเบšเบ›เบธเบ‡เปเบฅเบฐเปเบเป‰เป„เบ‚เป‚เบ„เบ‡เบเบฒเบ™ open-source, เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบชเป‰เบฒเบ‡เป‚เบ„เบ‡เบเบฒเบ™เบ—เบตเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบเบฑเบšเบ—เป‰เบญเบ‡เบ–เบดเปˆเบ™เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒ, เปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เบชเปเบฒเบ™เบฑเบเบ‡เบฒเบ™เบฅเบฒเบ„เบฒเบ–เบทเบเบ—เบตเปˆเบกเบต Hadoop เปเบฅเบฐ Presto เบขเบนเปˆเป€เบ—เบดเบ‡. เบชเบดเปˆเบ‡เบ—เบตเปˆ เบชเบณ เบ„เบฑเบ™เปเบกเปˆเบ™เบšเปเปˆเบขเบธเบ”เปเบฅเบฐเบเป‰เบฒเบงเป„เบ›เบ‚เป‰เบฒเบ‡ เปœเป‰เบฒ, เบ™เบฑเบš, เบŠเบญเบเบซเบฒเบงเบดเบ—เบตเปเบเป‰เป„เบ‚เบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเบˆเบฐเปเบˆเป‰เบ‡, เปเบฅเบฐเบ—เบธเบเบขเปˆเบฒเบ‡เบˆเบฐเบญเบญเบเบกเบฒเปเบ™เปˆเบ™เบญเบ™! เบ‚เปเปƒเบซเป‰เบ—เบธเบเบ„เบปเบ™เป‚เบŠเบเบ”เบต เปเบฅเบฐเบžเบปเบšเบเบฑเบ™เปƒเปเปˆ!

เปเบซเบผเปˆเบ‡เบ‚เปเป‰เบกเบนเบ™: www.habr.com

เป€เบžเบตเปˆเบกเบ„เบงเบฒเบกเบ„เบดเบ”เป€เบซเบฑเบ™