Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Π–ΠΈΠ²Π΅Π΅ΠΌ Π² нСвСроятно Π²Ρ€Π΅ΠΌΠ΅, ΠΊΠΎΠ³Π°Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π±ΡŠΡ€Π·ΠΎ ΠΈ лСсно Π΄Π° ΡΠ²ΡŠΡ€ΠΆΠ΅Ρ‚Π΅ няколко Π³ΠΎΡ‚ΠΎΠ²ΠΈ инструмСнта с ΠΎΡ‚Π²ΠΎΡ€Π΅Π½ ΠΊΠΎΠ΄, Π΄Π° Π³ΠΈ настроитС с β€žΠΈΠ·ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΎ ΡΡŠΠ·Π½Π°Π½ΠΈΠ΅β€œ спорСд ΡΡŠΠ²Π΅Ρ‚ΠΈΡ‚Π΅ Π½Π° stackoverflow, Π±Π΅Π· Π΄Π° сС Π·Π°Π΄ΡŠΠ»Π±ΠΎΡ‡Π°Π²Π°Ρ‚Π΅ Π² β€žΠΌΠ½ΠΎΠΆΠ΅ΡΡ‚Π²ΠΎΡ‚ΠΎ Π±ΡƒΠΊΠ²ΠΈβ€œ ΠΈ Π΄Π° стартиратС Π² Ρ‚ΡŠΡ€Π³ΠΎΠ²ΡΠΊΠ° Сксплоатация. И ΠΊΠΎΠ³Π°Ρ‚ΠΎ трябва Π΄Π° Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚Π΅/Ρ€Π°Π·ΡˆΠΈΡ€ΠΈΡ‚Π΅ ΠΈΠ»ΠΈ някой случайно рСстартира няколко машини - Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚Π΅, Ρ‡Π΅ Π΅ Π·Π°ΠΏΠΎΡ‡Π½Π°Π» някакъв Π½Π°Ρ‚Ρ€Π°ΠΏΡ‡ΠΈΠ² лош сън, всичко сС Π΅ услоТнило Π΄Ρ€Π°ΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ Π΄ΠΎ нСузнаваСмост, няма Π²Ρ€ΡŠΡ‰Π°Π½Π΅ Π½Π°Π·Π°Π΄, Π±ΡŠΠ΄Π΅Ρ‰Π΅Ρ‚ΠΎ Π΅ нСясно ΠΈ ΠΏΠΎ-сигурно, вмСсто Π΄Π° ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΈΡ€Π°Ρ‚Π΅, ΠΎΡ‚Π³Π»Π΅ΠΆΠ΄Π°ΠΉΡ‚Π΅ ΠΏΡ‡Π΅Π»ΠΈ ΠΈ ΠΏΡ€Π°Π²Π΅Ρ‚Π΅ сирСнС.

НС Π½Π°ΠΏΡ€Π°Π·Π½ΠΎ ΠΏΠΎ-ΠΎΠΏΠΈΡ‚Π½ΠΈΡ‚Π΅ ΠΊΠΎΠ»Π΅Π³ΠΈ, с Π³Π»Π°Π²ΠΈ, ΠΈΠ·ΠΏΡŠΡΡ‚Ρ€Π΅Π½ΠΈ с Π³Ρ€Π΅ΡˆΠΊΠΈ ΠΈ слСдоватСлно Π²Π΅Ρ‡Π΅ сиви, обмислят нСвСроятно Π±ΡŠΡ€Π·ΠΎΡ‚ΠΎ Ρ€Π°Π·ΠΏΠΎΠ»Π°Π³Π°Π½Π΅ Π½Π° ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ ΠΎΡ‚ β€žΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ΠΈβ€œ Π² β€žΠΊΡƒΠ±ΠΎΠ²Π΅β€œ Π½Π° дСсСтки ΡΡŠΡ€Π²ΡŠΡ€ΠΈ Π½Π° β€žΠΌΠΎΠ΄Π΅Ρ€Π½ΠΈ Π΅Π·ΠΈΡ†ΠΈβ€œ с Π²Π³Ρ€Π°Π΄Π΅Π½Π° ΠΏΠΎΠ΄Π΄Ρ€ΡŠΠΆΠΊΠ° Π·Π° асинхронСн Π½Π΅Π±Π»ΠΎΠΊΠΈΡ€Π°Ρ‰ I/O, усмихнСтС сС скромно. И Ρ‚Π΅ ΠΌΡŠΠ»Ρ‡Π°Π»ΠΈΠ²ΠΎ ΠΏΡ€ΠΎΠ΄ΡŠΠ»ΠΆΠ°Π²Π°Ρ‚ Π΄Π° ΠΏΡ€Π΅ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ β€žman psβ€œ, Π΄Π° сС ровят Π² изходния ΠΊΠΎΠ΄ Π½Π° β€žnginxβ€œ, Π΄ΠΎΠΊΠ°Ρ‚ΠΎ ΠΎΡ‡ΠΈΡ‚Π΅ ΠΈΠΌ Π½Π΅ ΠΊΡŠΡ€Π²ΡΡ‚, ΠΈ Π΄Π° ΠΏΠΈΡˆΠ°Ρ‚, ΠΏΠΈΡˆΠ°Ρ‚, ΠΏΠΈΡˆΠ°Ρ‚ ΠΌΠΎΠ΄ΡƒΠ»Π½ΠΈ тСстовС. ΠšΠΎΠ»Π΅Π³ΠΈΡ‚Π΅ знаят, Ρ‡Π΅ Π½Π°ΠΉ-интСрСсното Ρ‰Π΅ Π΄ΠΎΠΉΠ΄Π΅, ΠΊΠΎΠ³Π°Ρ‚ΠΎ β€žΠ²ΡΠΈΡ‡ΠΊΠΎ Ρ‚ΠΎΠ²Π°β€œ Π΅Π΄ΠΈΠ½ Π΄Π΅Π½ станС Π·Π°Π»ΠΎΠΆΠ΅Π½ΠΎ ΠΏΡ€Π΅Π· Π½ΠΎΡ‰Ρ‚Π° Π½Π° Нова Π³ΠΎΠ΄ΠΈΠ½Π°. И Ρ‚Π΅ Ρ‰Π΅ Π±ΡŠΠ΄Π°Ρ‚ ΠΏΠΎΠ΄ΠΏΠΎΠΌΠΎΠ³Π½Π°Ρ‚ΠΈ само ΠΎΡ‚ Π΄ΡŠΠ»Π±ΠΎΠΊΠΎΡ‚ΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅ Π½Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π°Ρ‚Π° Π½Π° unix, Π·Π°ΠΏΠ°ΠΌΠ΅Ρ‚Π΅Π½Π°Ρ‚Π° Ρ‚Π°Π±Π»ΠΈΡ†Π° Π½Π° ΡΡŠΡΡ‚ΠΎΡΠ½ΠΈΡΡ‚Π° Π½Π° TCP/IP ΠΈ основнитС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΈ Π·Π° сортиранС ΠΈ Ρ‚ΡŠΡ€ΡΠ΅Π½Π΅. Π—Π° Π΄Π° Π²ΡŠΡ€Π½Π΅Ρ‚Π΅ систСмата към ΠΆΠΈΠ²ΠΎΡ‚, Π΄ΠΎΠΊΠ°Ρ‚ΠΎ ΠΊΠ°ΠΌΠ±Π°Π½ΠΈΡ‚Π΅ бият.

О, Π΄Π°, ΠΌΠ°Π»ΠΊΠΎ сС разсСях, Π½ΠΎ Π΄Π°Π½ΠΎ успях Π΄Π° ΠΏΡ€Π΅Π΄Π°ΠΌ ΡΡŠΡΡ‚ΠΎΡΠ½ΠΈΠ΅Ρ‚ΠΎ Π½Π° ΠΎΡ‡Π°ΠΊΠ²Π°Π½Π΅.
ДнСс искам Π΄Π° сподСля нашия ΠΎΠΏΠΈΡ‚ Π² внСдряванСто Π½Π° ΡƒΠ΄ΠΎΠ±Π΅Π½ ΠΈ Π΅Π²Ρ‚ΠΈΠ½ стСк Π·Π° DataLake, ΠΊΠΎΠΉΡ‚ΠΎ Ρ€Π΅ΡˆΠ°Π²Π° ΠΏΠΎΠ²Π΅Ρ‡Π΅Ρ‚ΠΎ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ Π·Π°Π΄Π°Ρ‡ΠΈ Π² компанията Π·Π° напълно Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ структурни подраздСлСния.

ΠŸΡ€Π΅Π΄ΠΈ извСстно Π²Ρ€Π΅ΠΌΠ΅ стигнахмС Π΄ΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ, Ρ‡Π΅ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈΡ‚Π΅ всС ΠΏΠΎΠ²Π΅Ρ‡Π΅ сС нуТдаят ΠΎΡ‚ ΠΏΠ»ΠΎΠ΄ΠΎΠ²Π΅Ρ‚Π΅ ΠΊΠ°ΠΊΡ‚ΠΎ Π½Π° продуктовия, Ρ‚Π°ΠΊΠ° ΠΈ Π½Π° тСхничСския Π°Π½Π°Π»ΠΈΠ· (Π΄Π° Π½Π΅ Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌ Π·Π° Ρ‡Π΅Ρ€Π΅ΡˆΠΊΠ°Ρ‚Π° Π½Π° Ρ‚ΠΎΡ€Ρ‚Π°Ρ‚Π° ΠΏΠΎΠ΄ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° машинно ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅) ΠΈ Π·Π° Π΄Π° Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΈΡ‚Π΅ ΠΈ рисковСтС – трябва Π΄Π° ΡΡŠΠ±ΠΈΡ€Π°ΠΌΠ΅ ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ всС ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΈ ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ.

ОсновСн тСхничСски Π°Π½Π°Π»ΠΈΠ· Π² Bitrix24

ΠŸΡ€Π΅Π΄ΠΈ няколко Π³ΠΎΠ΄ΠΈΠ½ΠΈ, Π΅Π΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ с пусканСто Π½Π° услугата Bitrix24, Π½ΠΈΠ΅ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ инвСстирахмС Π²Ρ€Π΅ΠΌΠ΅ ΠΈ рСсурси Π² ΡΡŠΠ·Π΄Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° проста ΠΈ Π½Π°Π΄Π΅ΠΆΠ΄Π½Π° Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½Π° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ°, която Π΄Π° ΠΏΠΎΠΌΠΎΠ³Π½Π΅ Π±ΡŠΡ€Π·ΠΎ Π΄Π° сС видят ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈΡ‚Π΅ Π² инфраструктурата ΠΈ Π΄Π° сС ΠΏΠ»Π°Π½ΠΈΡ€Π° слСдващата ΡΡ‚ΡŠΠΏΠΊΠ°. Π Π°Π·Π±ΠΈΡ€Π° сС, ΠΏΡ€Π΅ΠΏΠΎΡ€ΡŠΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ Π΅ Π΄Π° Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ Π³ΠΎΡ‚ΠΎΠ²ΠΈ инструмСнти, ΠΊΠΎΠΈΡ‚ΠΎ са възмоТно Π½Π°ΠΉ-прости ΠΈ Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌΠΈ. Π’ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Π½Π° Ρ‚ΠΎΠ²Π° nagios бСшС ΠΈΠ·Π±Ρ€Π°Π½ Π·Π° ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ ΠΈ munin Π·Π° Π°Π½Π°Π»ΠΈΠ· ΠΈ визуализация. Π‘Π΅Π³Π° ΠΈΠΌΠ°ΠΌΠ΅ хиляди ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π² nagios, стотици Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΈ Π² munin ΠΈ Π½Π°ΡˆΠΈΡ‚Π΅ ΠΊΠΎΠ»Π΅Π³ΠΈ Π³ΠΈ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ всСки Π΄Π΅Π½. ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈΡ‚Π΅ са ясни, Π³Ρ€Π°Ρ„ΠΈΠΊΠΈΡ‚Π΅ са ясни, систСмата Ρ€Π°Π±ΠΎΡ‚ΠΈ Π½Π°Π΄Π΅ΠΆΠ΄Π½ΠΎ ΠΎΡ‚ няколко Π³ΠΎΠ΄ΠΈΠ½ΠΈ ΠΈ към нСя Ρ€Π΅Π΄ΠΎΠ²Π½ΠΎ сС добавят Π½ΠΎΠ²ΠΈ тСстовС ΠΈ Π³Ρ€Π°Ρ„ΠΈΠΊΠΈ: ΠΊΠΎΠ³Π°Ρ‚ΠΎ пуснСм Π½ΠΎΠ²Π° услуга Π² Сксплоатация, добавямС няколко тСста ΠΈ Π³Ρ€Π°Ρ„ΠΈΠΊΠΈ. ΠšΡŠΡΠΌΠ΅Ρ‚.

Π‘ ΠΏΡ€ΡŠΡΡ‚ Π½Π° пулса - Π Π°Π·ΡˆΠΈΡ€Π΅Π½ тСхничСски Π°Π½Π°Π»ΠΈΠ·

Π–Π΅Π»Π°Π½ΠΈΠ΅Ρ‚ΠΎ Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡Π°Π²Π°ΠΌΠ΅ информация Π·Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈΡ‚Π΅ β€žΠ²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉ-Π±ΡŠΡ€Π·ΠΎβ€œ Π½ΠΈ Π΄ΠΎΠ²Π΅Π΄Π΅ Π΄ΠΎ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΈ СкспСримСнти с прости ΠΈ Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌΠΈ инструмСнти - pinba ΠΈ xhprof.

Pinba Π½ΠΈ ΠΈΠ·ΠΏΡ€Π°Ρ‚ΠΈ статистичСски Π΄Π°Π½Π½ΠΈ Π² UDP ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ Π·Π° скоростта Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° Π½Π° части ΠΎΡ‚ ΡƒΠ΅Π± страници Π² PHP ΠΈ ΠΌΠΎΠΆΠ΅Ρ…ΠΌΠ΅ Π΄Π° Π²ΠΈΠ΄ΠΈΠΌ ΠΎΠ½Π»Π°ΠΉΠ½ Π² MySQL Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅Ρ‚ΠΎ (Pinba ΠΈΠ΄Π²Π° със собствСна MySQL машина Π·Π° Π±ΡŠΡ€Π· Π°Π½Π°Π»ΠΈΠ· Π½Π° ΡΡŠΠ±ΠΈΡ‚ΠΈΡ) ΠΊΡ€Π°Ρ‚ΡŠΠΊ списък с ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ ΠΈ Π΄Π° ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌ Π½Π° тях. И xhprof Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ Π½ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈ Π΄Π° ΡΡŠΠ±ΠΈΡ€Π°ΠΌΠ΅ Π³Ρ€Π°Ρ„ΠΈΠΊΠΈ Π½Π° ΠΈΠ·ΠΏΡŠΠ»Π½Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° Π½Π°ΠΉ-Π±Π°Π²Π½ΠΈΡ‚Π΅ PHP страници ΠΎΡ‚ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΈ ΠΈ Π΄Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ ΠΊΠ°ΠΊΠ²ΠΎ ΠΌΠΎΠΆΠ΅ Π΄Π° Π΄ΠΎΠ²Π΅Π΄Π΅ Π΄ΠΎ Ρ‚ΠΎΠ²Π° - спокойно, Π½Π°Π»ΠΈΠ²Π°Π½Π΅ Π½Π° Ρ‡Π°ΠΉ ΠΈΠ»ΠΈ Π½Π΅Ρ‰ΠΎ ΠΏΠΎ-силно.

ΠŸΡ€Π΅Π΄ΠΈ извСстно Π²Ρ€Π΅ΠΌΠ΅ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΡƒΠΌΡŠΡ‚ бСшС попълнСн с Π΄Ρ€ΡƒΠ³ доста прост ΠΈ Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌ Π΄Π²ΠΈΠ³Π°Ρ‚Π΅Π», Π±Π°Π·ΠΈΡ€Π°Π½ Π½Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΡŠΠΌΠ° Π·Π° ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎ индСксиранС, ΠΏΠ΅Ρ€Ρ„Π΅ΠΊΡ‚Π½ΠΎ Π²Π½Π΅Π΄Ρ€Π΅Π½ Π² Π»Π΅Π³Π΅Π½Π΄Π°Ρ€Π½Π°Ρ‚Π° Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° Lucene - Elastic/Kibana. ΠŸΡ€ΠΎΡΡ‚Π°Ρ‚Π° идСя Π·Π° ΠΌΠ½ΠΎΠ³ΠΎΠΏΠΎΡ‚ΠΎΡ‡Π½ΠΎ записванС Π½Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΈ Π² инвСрсСн индСкс Π½Π° Lucene, Π±Π°Π·ΠΈΡ€Π°Π½ Π½Π° ΡΡŠΠ±ΠΈΡ‚ΠΈΡ Π² рСгистрационнитС Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΈ Π±ΡŠΡ€Π·ΠΎ Ρ‚ΡŠΡ€ΡΠ΅Π½Π΅ Π² тях Ρ‡Ρ€Π΅Π· раздСлянС Π½Π° фасСти, сС ΠΎΠΊΠ°Π·Π° наистина ΠΏΠΎΠ»Π΅Π·Π½Π°.

Π’ΡŠΠΏΡ€Π΅ΠΊΠΈ доста тСхничСския външСн Π²ΠΈΠ΄ Π½Π° Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈΡ‚Π΅ Π² Kibana с ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈ ΠΎΡ‚ ниско Π½ΠΈΠ²ΠΎ ΠΊΠ°Ρ‚ΠΎ β€žΠΊΠΎΡ„Π°β€œ, β€žΡ‚Π΅Ρ‡Π°Ρ‰Π° Π½Π°Π³ΠΎΡ€Π΅β€œ ΠΈ прСоткрития Π΅Π·ΠΈΠΊ Π½Π° всС ΠΎΡ‰Π΅ Π½Π΅ напълно Π·Π°Π±Ρ€Π°Π²Π΅Π½Π°Ρ‚Π° Ρ€Π΅Π»Π°Ρ†ΠΈΠΎΠ½Π½Π° Π°Π»Π³Π΅Π±Ρ€Π°, ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚ΡŠΡ‚ Π·Π°ΠΏΠΎΡ‡Π½Π° Π΄Π° Π½ΠΈ ΠΏΠΎΠΌΠ°Π³Π° Π΄ΠΎΠ±Ρ€Π΅ Π² слСднитС Π·Π°Π΄Π°Ρ‡ΠΈ:

  • Колко PHP Π³Ρ€Π΅ΡˆΠΊΠΈ имашС ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΡŠΡ‚ Bitrix24 Π½Π° ΠΏΠΎΡ€Ρ‚Π°Π»Π° p1 ΠΏΡ€Π΅Π· послСдния час ΠΈ ΠΊΠΎΠΈ? Π Π°Π·Π±Π΅Ρ€Π΅Ρ‚Π΅, простСтС ΠΈ Π±ΡŠΡ€Π·ΠΎ ΠΊΠΎΡ€ΠΈΠ³ΠΈΡ€Π°ΠΉΡ‚Π΅.
  • Колко видСообаТдания са Π½Π°ΠΏΡ€Π°Π²Π΅Π½ΠΈ ΠΏΡ€Π΅Π· ΠΏΠΎΡ€Ρ‚Π°Π»ΠΈ Π² ГСрмания ΠΏΡ€Π΅Π· ΠΏΡ€Π΅Π΄Ρ…ΠΎΠ΄Π½ΠΈΡ‚Π΅ 24 часа, с ΠΊΠ°ΠΊΠ²ΠΎ качСство ΠΈ имашС Π»ΠΈ затруднСния с ΠΊΠ°Π½Π°Π»Π°/ΠΌΡ€Π΅ΠΆΠ°Ρ‚Π°?
  • Колко Π΄ΠΎΠ±Ρ€Π΅ Ρ€Π°Π±ΠΎΡ‚ΠΈ функционалността Π½Π° систСмата (Π½Π°ΡˆΠ΅Ρ‚ΠΎ C Ρ€Π°Π·ΡˆΠΈΡ€Π΅Π½ΠΈΠ΅ Π·Π° PHP), ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€Π°Π½ΠΎ ΠΎΡ‚ ΠΈΠ·Ρ‚ΠΎΡ‡Π½ΠΈΠΊΠ° Π² Π½Π°ΠΉ-Π½ΠΎΠ²Π°Ρ‚Π° актуализация Π½Π° услугата ΠΈ пуснато Π½Π° ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΈ? Има Π»ΠΈ сСгмСнтни Π³Ρ€Π΅ΡˆΠΊΠΈ?
  • ΠŸΠΎΠ±ΠΈΡ€Π°Ρ‚ Π»ΠΈ сС клиСнтскитС Π΄Π°Π½Π½ΠΈ Π² PHP ΠΏΠ°ΠΌΠ΅Ρ‚Ρ‚Π°? Има Π»ΠΈ някакви Π³Ρ€Π΅ΡˆΠΊΠΈ относно ΠΏΡ€Π΅Π²ΠΈΡˆΠ°Π²Π°Π½Π΅ Π½Π° ΠΏΠ°ΠΌΠ΅Ρ‚Ρ‚Π°, Ρ€Π°Π·ΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° Π·Π° процСси: β€žΠΈΠ·Ρ‡Π΅Ρ€ΠΏΠ°Π½Π° ΠΏΠ°ΠΌΠ΅Ρ‚β€œ? НамСрСтС ΠΈ Π½Π΅ΡƒΡ‚Ρ€Π°Π»ΠΈΠ·ΠΈΡ€Π°ΠΉΡ‚Π΅.

Π•Ρ‚ΠΎ Π΅Π΄ΠΈΠ½ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π΅Π½ ΠΏΡ€ΠΈΠΌΠ΅Ρ€. Π’ΡŠΠΏΡ€Π΅ΠΊΠΈ Π·Π°Π΄ΡŠΠ»Π±ΠΎΡ‡Π΅Π½ΠΎ ΠΈ многостСпСнно тСстванС, ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΡŠΡ‚ с ΠΌΠ½ΠΎΠ³ΠΎ нСстандартСн случай ΠΈ ΠΏΠΎΠ²Ρ€Π΅Π΄Π΅Π½ΠΈ Π²Ρ…ΠΎΠ΄Π½ΠΈ Π΄Π°Π½Π½ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈ досадна ΠΈ Π½Π΅ΠΎΡ‡Π°ΠΊΠ²Π°Π½Π° Π³Ρ€Π΅ΡˆΠΊΠ°, ΠΏΡ€ΠΎΠ·Π²ΡƒΡ‡Π° сирСна ΠΈ Π·Π°ΠΏΠΎΡ‡Π½Π° ΠΏΡ€ΠΎΡ†Π΅ΡΡŠΡ‚ Π½Π° Π±ΡŠΡ€Π·ΠΎ отстраняванС:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

ОсвСн Ρ‚ΠΎΠ²Π° kibana Π²ΠΈ позволява Π΄Π° ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ‚Π΅ извСстия Π·Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈ ΡΡŠΠ±ΠΈΡ‚ΠΈΡ ΠΈ Π·Π° ΠΊΡ€Π°Ρ‚ΠΊΠΎ Π²Ρ€Π΅ΠΌΠ΅ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚ΡŠΡ‚ Π² компанията Π·Π°ΠΏΠΎΡ‡Π½Π° Π΄Π° сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° ΠΎΡ‚ дСсСтки слуТитСли ΠΎΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΎΡ‚Π΄Π΅Π»ΠΈ - ΠΎΡ‚ тСхничСска ΠΏΠΎΠ΄Π΄Ρ€ΡŠΠΆΠΊΠ° ΠΈ Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ Π΄ΠΎ QA.

ДСйността Π½Π° всСки ΠΎΡ‚Π΄Π΅Π» Π² Ρ€Π°ΠΌΠΊΠΈΡ‚Π΅ Π½Π° компанията стана ΡƒΠ΄ΠΎΠ±Π½Π° Π·Π° прослСдяванС ΠΈ ΠΈΠ·ΠΌΠ΅Ρ€Π²Π°Π½Π΅ - вмСсто Ρ€ΡŠΡ‡Π½ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° рСгистрационни Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π½Π° ΡΡŠΡ€Π²ΡŠΡ€ΠΈ, трябва само Π΄Π° настроитС парсинг Π½Π° рСгистрационни Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ вСднъТ ΠΈ Π΄Π° Π³ΠΈ ΠΈΠ·ΠΏΡ€Π°Ρ‚ΠΈΡ‚Π΅ Π½Π° Сластичния ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€, Π·Π° Π΄Π° сС насладитС, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π½Π° ΡΡŠΠ·Π΅Ρ€Ρ†Π°Π²Π°Π½Π΅ Π² kibana Ρ‚Π°Π±Π»ΠΎ Π·Π° ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ броя Π½Π° ΠΏΡ€ΠΎΠ΄Π°Π΄Π΅Π½ΠΈΡ‚Π΅ Π΄Π²ΡƒΠ³Π»Π°Π²ΠΈ ΠΊΠΎΡ‚Π΅Π½Ρ†Π°, ΠΎΡ‚ΠΏΠ΅Ρ‡Π°Ρ‚Π°Π½ΠΈ Π½Π° 3-D ΠΏΡ€ΠΈΠ½Ρ‚Π΅Ρ€ Π·Π° послСдния Π»ΡƒΠ½Π΅Π½ мСсСц.

ОсновСн бизнСс анализ

ВсСки Π·Π½Π°Π΅, Ρ‡Π΅ бизнСс Π°Π½Π°Π»ΠΈΠ·ΠΈΡ‚Π΅ Π² ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈΡ‚Π΅ чСсто Π·Π°ΠΏΠΎΡ‡Π²Π°Ρ‚ с ΠΈΠ·ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π°, Π΄Π°, Excel. Но Π½Π°ΠΉ-Π²Π°ΠΆΠ½ΠΎΡ‚ΠΎ Π΅, Ρ‡Π΅ Π½Π΅ ΡΠ²ΡŠΡ€ΡˆΠ²Π° Π΄ΠΎΡ‚ΡƒΠΊ. Базираният Π² ΠΎΠ±Π»Π°ΠΊΠ° Google Analytics ΡΡŠΡ‰ΠΎ Π½Π°Π»ΠΈΠ²Π° масло Π² огъня – Π±ΡŠΡ€Π·ΠΎ Π·Π°ΠΏΠΎΡ‡Π²Π°Ρ‚Π΅ Π΄Π° свикватС с Ρ…ΡƒΠ±Π°Π²ΠΈΡ‚Π΅ Π½Π΅Ρ‰Π°.

Π’ Π½Π°ΡˆΠ°Ρ‚Π° Ρ…Π°Ρ€ΠΌΠΎΠ½ΠΈΡ‡Π½ΠΎ Ρ€Π°Π·Π²ΠΈΠ²Π°Ρ‰Π° сС компания Ρ‚ΡƒΠΊ-Ρ‚Π°ΠΌ Π·Π°ΠΏΠΎΡ‡Π½Π°Ρ…Π° Π΄Π° сС появяват β€žΠΏΡ€ΠΎΡ€ΠΎΡ†ΠΈβ€ Π½Π° ΠΏΠΎ-ΠΈΠ½Ρ‚Π΅Π½Π·ΠΈΠ²Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° с ΠΏΠΎ-Π³ΠΎΠ»Π΅ΠΌΠΈ Π΄Π°Π½Π½ΠΈ. НСобходимостта ΠΎΡ‚ ΠΏΠΎ-Π·Π°Π΄ΡŠΠ»Π±ΠΎΡ‡Π΅Π½ΠΈ ΠΈ многостранни ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΈ Π·Π°ΠΏΠΎΡ‡Π½Π° Ρ€Π΅Π΄ΠΎΠ²Π½ΠΎ Π΄Π° сС появява ΠΈ с усилията Π½Π° ΠΌΠΎΠΌΡ‡Π΅Ρ‚Π° ΠΎΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΎΡ‚Π΄Π΅Π»ΠΈ ΠΏΡ€Π΅Π΄ΠΈ Π²Ρ€Π΅ΠΌΠ΅ бСшС ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Π½ΠΎ просто ΠΈ ΠΏΡ€Π°ΠΊΡ‚ΠΈΡ‡Π½ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ - комбинация ΠΎΡ‚ ClickHouse ΠΈ PowerBI.

Доста дълго Π²Ρ€Π΅ΠΌΠ΅ Ρ‚ΠΎΠ²Π° гъвкаво Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ помагашС ΠΌΠ½ΠΎΠ³ΠΎ, Π½ΠΎ постСпСнно Π·Π°ΠΏΠΎΡ‡Π½Π° Π΄Π° ΠΈΠ΄Π²Π° Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ, Ρ‡Π΅ ClickHouse Π½Π΅ Π΅ Π³ΡƒΠΌΠ° ΠΈ Π½Π΅ ΠΌΠΎΠΆΠ΅ Π΄Π° сС ΠΏΠΎΠ΄ΠΈΠ³Ρ€Π°Π²Π° Ρ‚Π°ΠΊΠ°.

Π’ΡƒΠΊ Π΅ Π²Π°ΠΆΠ½ΠΎ Π΄Π° Ρ€Π°Π·Π±Π΅Ρ€Π΅Ρ‚Π΅ Π΄ΠΎΠ±Ρ€Π΅, Ρ‡Π΅ ClickHouse, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ Π½Π° Druid, ΠΊΠ°Ρ‚ΠΎ Vertica, ΠΊΠ°Ρ‚ΠΎ Amazon RedShift (ΠΊΠΎΠΉΡ‚ΠΎ Π΅ Π±Π°Π·ΠΈΡ€Π°Π½ Π½Π° postgres), са Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ машини, ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€Π°Π½ΠΈ Π·Π° доста ΡƒΠ΄ΠΎΠ±Π½ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈ (суми, агрСгирания, ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ-максимум ΠΏΠΎ ΠΊΠΎΠ»ΠΎΠ½Π° ΠΈ няколко възмоТни съСдинСния ), Π·Π°Ρ‰ΠΎΡ‚ΠΎ ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Π½ΠΈ Π·Π° Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΡΡŠΡ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ Π½Π° ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΎΡ‚ Ρ€Π΅Π»Π°Ρ†ΠΈΠΎΠ½Π½ΠΈ Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ, Π·Π° Ρ€Π°Π·Π»ΠΈΠΊΠ° ΠΎΡ‚ MySQL ΠΈ Π΄Ρ€ΡƒΠ³ΠΈ (ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€Π°Π½ΠΈ към Ρ€Π΅Π΄ΠΎΠ²Π΅) Π±Π°Π·ΠΈ Π΄Π°Π½Π½ΠΈ, ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ Π½ΠΈ.

По ΡΡŠΡ‰Π΅ΡΡ‚Π²ΠΎ ClickHouse Π΅ просто ΠΏΠΎ-ΠΎΠ±Π΅ΠΌΠ½Π° β€žΠ±Π°Π·Π° Π΄Π°Π½Π½ΠΈβ€œ, с Π½Π΅ ΠΌΠ½ΠΎΠ³ΠΎ ΡƒΠ΄ΠΎΠ±Π½ΠΎ вмъкванС Ρ‚ΠΎΡ‡ΠΊΠ° ΠΏΠΎ Ρ‚ΠΎΡ‡ΠΊΠ° (Ρ‚Π°ΠΊΠ° Π΅ ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½ΠΎ, всичко Π΅ Π½Π°Ρ€Π΅Π΄), Π½ΠΎ приятни Π°Π½Π°Π»ΠΈΠ·ΠΈ ΠΈ Π½Π°Π±ΠΎΡ€ ΠΎΡ‚ интСрСсни ΠΌΠΎΡ‰Π½ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π·Π° Ρ€Π°Π±ΠΎΡ‚Π° с Π΄Π°Π½Π½ΠΈ. Π”Π°, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄ΠΎΡ€ΠΈ Π΄Π° ΡΡŠΠ·Π΄Π°Π΄Π΅Ρ‚Π΅ ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ - Π½ΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚Π΅, Ρ‡Π΅ Π·Π°Π±ΠΈΠ²Π°Π½Π΅Ρ‚ΠΎ Π½Π° ΠΏΠΈΡ€ΠΎΠ½ΠΈ с микроскоп Π½Π΅ Π΅ съвсСм ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ ΠΈ Π·Π°ΠΏΠΎΡ‡Π½Π°Ρ…ΠΌΠ΅ Π΄Π° Ρ‚ΡŠΡ€ΡΠΈΠΌ Π΄Ρ€ΡƒΠ³ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ.

Π’ΡŠΡ€ΡΠ΅Π½Π΅ Π½Π° python ΠΈ Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΈ

ΠΠ°ΡˆΠ°Ρ‚Π° компания ΠΈΠΌΠ° ΠΌΠ½ΠΎΠ³ΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ ΠΏΠΈΡˆΠ°Ρ‚ ΠΊΠΎΠ΄ ΠΏΠΎΡ‡Ρ‚ΠΈ всСки Π΄Π΅Π½ Π² ΠΏΡ€ΠΎΠ΄ΡŠΠ»ΠΆΠ΅Π½ΠΈΠ΅ Π½Π° 10-20 Π³ΠΎΠ΄ΠΈΠ½ΠΈ Π½Π° PHP, JavaScript, C#, C/C++, Java, Go, Rust, Python, Bash. Има ΠΈ ΠΌΠ½ΠΎΠ³ΠΎ ΠΎΠΏΠΈΡ‚Π½ΠΈ систСмни администратори, ΠΊΠΎΠΈΡ‚ΠΎ са ΠΏΡ€Π΅ΠΆΠΈΠ²Π΅Π»ΠΈ ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΎΡ‚ Π΅Π΄Π½Π° Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎ нСвСроятна катастрофа, която Π½Π΅ сС вписва Π² Π·Π°ΠΊΠΎΠ½ΠΈΡ‚Π΅ Π½Π° статистиката (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΊΠΎΠ³Π°Ρ‚ΠΎ ΠΏΠΎ-голямата част ΠΎΡ‚ дисковСтС Π² raid-10 са ΡƒΠ½ΠΈΡ‰ΠΎΠΆΠ΅Π½ΠΈ ΠΎΡ‚ силСн ΡƒΠ΄Π°Ρ€ ΠΎΡ‚ мълния). ΠŸΡ€ΠΈ Ρ‚Π°ΠΊΠΈΠ²Π° обстоятСлства дълго Π²Ρ€Π΅ΠΌΠ΅ Π½Π΅ бСшС ясно ΠΊΠ°ΠΊΠ²ΠΎ Π΅ β€žpython analystβ€œ. Python Π΅ ΠΊΠ°Ρ‚ΠΎ PHP, само Ρ‡Π΅ ΠΈΠΌΠ΅Ρ‚ΠΎ Π΅ ΠΌΠ°Π»ΠΊΠΎ ΠΏΠΎ-дълго ΠΈ ΠΈΠΌΠ° ΠΌΠ°Π»ΠΊΠΎ ΠΏΠΎ-ΠΌΠ°Π»ΠΊΠΎ слСди ΠΎΡ‚ вСщСства, промСнящи ΡΡŠΠ·Π½Π°Π½ΠΈΠ΅Ρ‚ΠΎ, Π² изходния ΠΊΠΎΠ΄ Π½Π° ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ‚ΠΎΡ€Π°. Π’ΡŠΠΏΡ€Π΅ΠΊΠΈ Ρ‚ΠΎΠ²Π°, Ρ‚ΡŠΠΉ ΠΊΠ°Ρ‚ΠΎ бяха създадСни всС ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΈ ΠΏΠΎΠ²Π΅Ρ‡Π΅ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΈ, ΠΎΠΏΠΈΡ‚Π½ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈ Π·Π°ΠΏΠΎΡ‡Π½Π°Ρ…Π° всС ΠΏΠΎΠ²Π΅Ρ‡Π΅ Π΄Π° Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° тясната спСциализация Π² инструмСнти ΠΊΠ°Ρ‚ΠΎ numpy, pandas, matplotlib, seaborn.
Π Π΅ΡˆΠ°Π²Π°Ρ‰Π°Ρ‚Π° роля Π½Π°ΠΉ-вСроятно Π΅ ΠΈΠ·ΠΈΠ³Ρ€Π°Π»Π° Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎΡ‚ΠΎ ΠΏΡ€ΠΈΠΏΠ°Π΄Π°Π½Π΅ Π½Π° слуТитСли ΠΎΡ‚ комбинацията ΠΎΡ‚ Π΄ΡƒΠΌΠΈΡ‚Π΅ β€žΠ»ΠΎΠ³ΠΈΡΡ‚ΠΈΡ‡Π½Π° Ρ€Π΅Π³Ρ€Π΅ΡΠΈΡβ€œ ΠΈ дСмонстрацията Π½Π° Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΎΡ‚Ρ‡ΠΈΡ‚Π°Π½Π΅ Π½Π° Π³ΠΎΠ»Π΅ΠΌΠΈ Π΄Π°Π½Π½ΠΈ, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ, Π΄Π°, Π΄Π°, pyspark.

Apache Spark, Π½Π΅Π³ΠΎΠ²Π°Ρ‚Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»Π½Π° ΠΏΠ°Ρ€Π°Π΄ΠΈΠ³ΠΌΠ°, Π½Π° която Ρ€Π΅Π»Π°Ρ†ΠΈΠΎΠ½Π½Π°Ρ‚Π° Π°Π»Π³Π΅Π±Ρ€Π° пасва ΠΏΠ΅Ρ€Ρ„Π΅ΠΊΡ‚Π½ΠΎ, ΠΈ Π½Π΅Π³ΠΎΠ²ΠΈΡ‚Π΅ Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΠΈ Π½Π°ΠΏΡ€Π°Π²ΠΈΡ…Π° Ρ‚Π°ΠΊΠΎΠ²Π° Π²ΠΏΠ΅Ρ‡Π°Ρ‚Π»Π΅Π½ΠΈΠ΅ Π½Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈΡ‚Π΅, свикнали с MySQL, Ρ‡Π΅ нСобходимостта ΠΎΡ‚ ΡƒΠΊΡ€Π΅ΠΏΠ²Π°Π½Π΅ Π½Π° Ρ€Π΅Π΄ΠΈΡ†ΠΈΡ‚Π΅ с ΠΎΠΏΠΈΡ‚Π½ΠΈ Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΈ стана ясна ΠΊΠ°Ρ‚ΠΎ бял Π΄Π΅Π½.

Π”ΠΎΠΏΡŠΠ»Π½ΠΈΡ‚Π΅Π»Π½ΠΈ ΠΎΠΏΠΈΡ‚ΠΈ Π½Π° Apache Spark/Hadoop Π΄Π° ΠΈΠ·Π»Π΅Ρ‚ΠΈ ΠΈ ΠΊΠ°ΠΊΠ²ΠΎ Π½Π΅ Π²ΡŠΡ€Π²ΠΈ съвсСм спорСд сцСнария

Π‘ΠΊΠΎΡ€ΠΎ ΠΎΠ±Π°Ρ‡Π΅ стана ясно, Ρ‡Π΅ Π½Π΅Ρ‰ΠΎ систСмно Π½Π΅ Π΅ Π½Π°Ρ€Π΅Π΄ със Spark ΠΈΠ»ΠΈ просто Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π΄Π° си ΠΈΠ·ΠΌΠΈΠ΅Ρ‚Π΅ Ρ€ΡŠΡ†Π΅Ρ‚Π΅ ΠΏΠΎ-Π΄ΠΎΠ±Ρ€Π΅. Ако ΡΡ‚Π΅ΠΊΡŠΡ‚ Hadoop/MapReduce/Lucene Π΅ Π½Π°ΠΏΡ€Π°Π²Π΅Π½ ΠΎΡ‚ доста ΠΎΠΏΠΈΡ‚Π½ΠΈ програмисти, ΠΊΠΎΠ΅Ρ‚ΠΎ Π΅ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Π°ΠΊΠΎ сС Π²Π³Π»Π΅Π΄Π°Ρ‚Π΅ Π²Π½ΠΈΠΌΠ°Ρ‚Π΅Π»Π½ΠΎ Π² изходния ΠΊΠΎΠ΄ Π² Java ΠΈΠ»ΠΈ ΠΈΠ΄Π΅ΠΈΡ‚Π΅ Π½Π° Π”ΡŠΠ³ ΠšΡŠΡ‚ΠΈΠ½Π³ Π² Lucene, Ρ‚ΠΎΠ³Π°Π²Π° Spark Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎ Π΅ написан Π½Π° Скзотичния Π΅Π·ΠΈΠΊ Scala, ΠΊΠΎΠΉΡ‚ΠΎ Π΅ ΠΌΠ½ΠΎΠ³ΠΎ спорСн ΠΎΡ‚ Π³Π»Π΅Π΄Π½Π° Ρ‚ΠΎΡ‡ΠΊΠ° Π½Π° практичност ΠΈ Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° Π½Π΅ сС Ρ€Π°Π·Π²ΠΈΠ²Π°. И рСдовният спад Π² изчислСнията Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€Π° Π½Π° Spark ΠΏΠΎΡ€Π°Π΄ΠΈ Π½Π΅Π»ΠΎΠ³ΠΈΡ‡Π½Π° ΠΈ Π½Π΅ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ·Ρ€Π°Ρ‡Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° с Ρ€Π°Π·ΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° ΠΏΠ°ΠΌΠ΅Ρ‚Ρ‚Π° Π·Π° ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ Π·Π° намаляванС (ΠΌΠ½ΠΎΠ³ΠΎ ΠΊΠ»ΡŽΡ‡ΠΎΠ²Π΅ пристигат навСднъТ) създадС ΠΎΠΊΠΎΠ»ΠΎ Π½Π΅Π³ΠΎ ΠΎΡ€Π΅ΠΎΠ» Π½Π° Π½Π΅Ρ‰ΠΎ, ΠΊΠΎΠ΅Ρ‚ΠΎ ΠΈΠΌΠ° място Π·Π° растСТ. ОсвСн Ρ‚ΠΎΠ²Π° ситуацията сС влошава ΠΎΡ‚ голям Π±Ρ€ΠΎΠΉ странни ΠΎΡ‚Π²ΠΎΡ€Π΅Π½ΠΈ ΠΏΠΎΡ€Ρ‚ΠΎΠ²Π΅, Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, ΠΊΠΎΠΈΡ‚ΠΎ растат Π½Π° Π½Π°ΠΉ-Π½Π΅Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌΠΈΡ‚Π΅ мСста ΠΈ адски зависимости ΠΎΡ‚ jar - ΠΊΠΎΠ΅Ρ‚ΠΎ Π½Π°ΠΊΠ°Ρ€Π° систСмнитС администратори Π΄Π° ΠΈΠ·ΠΏΠΈΡ‚Π°Ρ‚ Π΅Π΄Π½ΠΎ чувство, ΠΊΠΎΠ΅Ρ‚ΠΎ Π΅ Π΄ΠΎΠ±Ρ€Π΅ извСстно ΠΎΡ‚ дСтството: яростна ΠΎΠΌΡ€Π°Π·Π° (ΠΈΠ»ΠΈ ΠΌΠΎΠΆΠ΅ Π±ΠΈ Ρ‚Ρ€ΡΠ±Π²Π°ΡˆΠ΅ Π΄Π° си измият Ρ€ΡŠΡ†Π΅Ρ‚Π΅ със сапун).

Π’ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Π½Π° Ρ‚ΠΎΠ²Π° β€žΠΎΡ†Π΅Π»ΡΡ…ΠΌΠ΅β€œ няколко Π²ΡŠΡ‚Ρ€Π΅ΡˆΠ½ΠΈ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°, ΠΊΠΎΠΈΡ‚ΠΎ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚ Apache Spark (Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ Spark Streaming, Spark SQL) ΠΈ СкосистСмата Hadoop (ΠΈ Ρ‚Π°ΠΊΠ° Π½Π°Ρ‚Π°Ρ‚ΡŠΠΊ, ΠΈ Ρ‚Π°ΠΊΠ° Π½Π°Ρ‚Π°Ρ‚ΡŠΠΊ). Π’ΡŠΠΏΡ€Π΅ΠΊΠΈ Ρ„Π°ΠΊΡ‚Π°, Ρ‡Π΅ с Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π½Π° Π²Ρ€Π΅ΠΌΠ΅Ρ‚ΠΎ сС Π½Π°ΡƒΡ‡ΠΈΡ…ΠΌΠ΅ Π΄Π° Π³ΠΎ ΠΏΠΎΠ΄Π³ΠΎΡ‚Π²ΠΈΠΌ ΠΈ наблюдавамС доста Π΄ΠΎΠ±Ρ€Π΅ ΠΈ β€žΡ‚ΠΎβ€œ практичСски спря Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎ Π΄Π° сС срива ΠΏΠΎΡ€Π°Π΄ΠΈ ΠΏΡ€ΠΎΠΌΠ΅Π½ΠΈ Π² СстСството Π½Π° Π΄Π°Π½Π½ΠΈΡ‚Π΅ ΠΈ дисбаланса Π½Π° Π΅Π΄Π½ΠΎΡ€ΠΎΠ΄Π½ΠΎΡ‚ΠΎ RDD Ρ…Π΅ΡˆΠΈΡ€Π°Π½Π΅, ΠΆΠ΅Π»Π°Π½ΠΈΠ΅Ρ‚ΠΎ Π΄Π° Π²Π·Π΅ΠΌΠ΅ΠΌ Π½Π΅Ρ‰ΠΎ Π²Π΅Ρ‡Π΅ Π³ΠΎΡ‚ΠΎΠ²ΠΎ , Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Π½ ΠΈ администриран някъдС Π² ΠΎΠ±Π»Π°ΠΊΠ°, ΡΡ‚Π°Π²Π°ΡˆΠ΅ всС ΠΏΠΎ-силСн ΠΈ ΠΏΠΎ-силСн. По Ρ‚ΠΎΠ²Π° Π²Ρ€Π΅ΠΌΠ΅ сС ΠΎΠΏΠΈΡ‚Π°Ρ…ΠΌΠ΅ Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ Π³ΠΎΡ‚ΠΎΠ²Π°Ρ‚Π° ΠΎΠ±Π»Π°Ρ‡Π½Π° сборка Π½Π° Amazon Web Services - EMR ΠΈ впослСдствиС сС ΠΎΠΏΠΈΡ‚Π° Π΄Π° Ρ€Π΅ΡˆΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ с Π½Π΅Π³ΠΎ. EMR Π΅ Apache Spark, ΠΏΠΎΠ΄Π³ΠΎΡ‚Π²Π΅Π½ ΠΎΡ‚ Amazon с Π΄ΠΎΠΏΡŠΠ»Π½ΠΈΡ‚Π΅Π»Π΅Π½ софтуСр ΠΎΡ‚ СкосистСмата, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ Π½Π° ΠΊΠΎΠΌΠΏΠΈΠ»Π°Ρ†ΠΈΠΈΡ‚Π΅ Π½Π° Cloudera/Hortonworks.

Π“ΡƒΠΌΠ΅Π½ΠΎΡ‚ΠΎ ΡΡŠΡ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π·Π° Π°Π½Π°Π»ΠΈΠ·ΠΈ Π΅ спСшна нСобходимост

ΠžΠΏΠΈΡ‚ΡŠΡ‚ ΠΎΡ‚ β€žΠ³ΠΎΡ‚Π²Π΅Π½Π΅Ρ‚ΠΎβ€œ Π½Π° Hadoop/Spark с изгаряния Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ части Π½Π° тялото Π½Π΅ бСшС Π½Π°ΠΏΡ€Π°Π·Π΅Π½. НСобходимостта ΠΎΡ‚ създаванС Π½Π° Π΅Π΄ΠΈΠ½Π½ΠΎ, Π΅Π²Ρ‚ΠΈΠ½ΠΎ ΠΈ Π½Π°Π΄Π΅ΠΆΠ΄Π½ΠΎ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅ Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, ΠΊΠΎΠ΅Ρ‚ΠΎ Π±ΠΈ Π±ΠΈΠ»ΠΎ устойчиво Π½Π° Ρ…Π°Ρ€Π΄ΡƒΠ΅Ρ€Π½ΠΈ ΠΏΠΎΠ²Ρ€Π΅Π΄ΠΈ ΠΈ Π² ΠΊΠΎΠ΅Ρ‚ΠΎ Π±ΠΈ Π±ΠΈΠ»ΠΎ възмоТно Π΄Π° сС ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Ρ‚ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈ ΠΎΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ систСми ΠΈ Π΄Π° сС правят Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΈ ΠΈ Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΈ във Π²Ρ€Π΅ΠΌΠ΅Ρ‚ΠΎ ΠΏΡ€ΠΎΠ±ΠΈ Π·Π° ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΈ ΠΎΡ‚ Ρ‚Π΅Π·ΠΈ Π΄Π°Π½Π½ΠΈ, става всС ΠΏΠΎ-голяма ясно.

Π˜ΡΠΊΠ°Ρ… ΡΡŠΡ‰ΠΎ Ρ‚Π°ΠΊΠ° Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ Π½Π° софтуСра Π½Π° Ρ‚Π°Π·ΠΈ ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ° Π΄Π° Π½Π΅ сС ΠΏΡ€Π΅Π²ΡŠΡ€Π½Π΅ Π² новогодишСн ΠΊΠΎΡˆΠΌΠ°Ρ€ с Ρ‡Π΅Ρ‚Π΅Π½Π΅ Π½Π° 20-странични слСди Π½Π° Java ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° ΠΊΠΈΠ»ΠΎΠΌΠ΅Ρ‚Ρ€ΠΈΡ‡Π½ΠΈ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΈ рСгистрационни Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€Π° с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° Spark History Server ΠΈ Π»ΡƒΠΏΠ° със Π·Π°Π΄Π½ΠΎ освСтяванС. Π˜ΡΠΊΠ°Ρ… Π΄Π° ΠΈΠΌΠ°ΠΌ прост ΠΈ ΠΏΡ€ΠΎΠ·Ρ€Π°Ρ‡Π΅Π½ инструмСнт, ΠΊΠΎΠΉΡ‚ΠΎ Π½Π΅ изисква Ρ€Π΅Π΄ΠΎΠ²Π½ΠΎ Π³ΠΌΡƒΡ€ΠΊΠ°Π½Π΅ ΠΏΠΎΠ΄ ΠΊΠ°ΠΏΠ°ΠΊΠ°, Π°ΠΊΠΎ стандартната заявка Π½Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ° MapReduce спрС Π΄Π° сС изпълнява, ΠΊΠΎΠ³Π°Ρ‚ΠΎ Ρ€Π°Π±ΠΎΡ‚Π½ΠΈΠΊΡŠΡ‚ Π·Π° Ρ€Π΅Π΄ΡƒΡ†ΠΈΡ€Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ ΠΏΠ°Π΄Π½Π΅ ΠΎΡ‚ ΠΏΠ°ΠΌΠ΅Ρ‚Ρ‚Π° ΠΏΠΎΡ€Π°Π΄ΠΈ Π½Π΅ ΠΌΠ½ΠΎΠ³ΠΎ Π΄ΠΎΠ±Ρ€Π΅ ΠΈΠ·Π±Ρ€Π°Π½ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΡŠΠΌ Π·Π° раздСлянС Π½Π° ΠΈΠ·Ρ…ΠΎΠ΄Π½ΠΈ Π΄Π°Π½Π½ΠΈ.

Amazon S3 ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ Π»ΠΈ Π΅ Π·Π° DataLake?

ΠžΠΏΠΈΡ‚ΡŠΡ‚ с Hadoop/MapReduce Π½ΠΈ Π½Π°ΡƒΡ‡ΠΈ, Ρ‡Π΅ сС Π½ΡƒΠΆΠ΄Π°Π΅ΠΌ ΠΎΡ‚ ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠ°, Π½Π°Π΄Π΅ΠΆΠ΄Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π° систСма ΠΈ ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΈ Ρ€Π°Π±ΠΎΡ‚Π½ΠΈΡ†ΠΈ ΠΎΡ‚Π³ΠΎΡ€Π΅ ΠΉ, ΠΊΠΎΠΈΡ‚ΠΎ β€žΠΈΠ΄Π²Π°Ρ‚β€œ ΠΏΠΎ-Π±Π»ΠΈΠ·ΠΎ Π΄ΠΎ Π΄Π°Π½Π½ΠΈΡ‚Π΅, Π·Π° Π΄Π° Π½Π΅ управляват Π΄Π°Π½Π½ΠΈΡ‚Π΅ ΠΏΡ€Π΅Π· ΠΌΡ€Π΅ΠΆΠ°Ρ‚Π°. Π Π°Π±ΠΎΡ‚Π½ΠΈΡ†ΠΈΡ‚Π΅ трябва Π΄Π° ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° Ρ‡Π΅Ρ‚Π°Ρ‚ Π΄Π°Π½Π½ΠΈ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈ, Π½ΠΎ Π·Π° ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡ΠΈΡ‚Π°Π½Π΅ Π΅ Π΄Π° Π½Π΅ Ρ‡Π΅Ρ‚Π°Ρ‚ Π½Π΅Π½ΡƒΠΆΠ½Π° информация ΠΈ Π΄Π° ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Ρ‚ Π΄Π°Π½Π½ΠΈ ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ във Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈ, ΡƒΠ΄ΠΎΠ±Π½ΠΈ Π·Π° Ρ€Π°Π±ΠΎΡ‚Π½ΠΈΡ†ΠΈΡ‚Π΅.

ΠžΡ‰Π΅ вСднъТ основната идСя. Няма ΠΆΠ΅Π»Π°Π½ΠΈΠ΅ Π΄Π° β€žΠΈΠ·Π»Π΅Π΅Ρ‚Π΅β€œ Π³ΠΎΠ»Π΅ΠΌΠΈ Π΄Π°Π½Π½ΠΈ Π² Π΅Π΄ΠΈΠ½ ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€Π΅Π½ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π΅Π½ Π΄Π²ΠΈΠ³Π°Ρ‚Π΅Π», ΠΊΠΎΠΉΡ‚ΠΎ Ρ€Π°Π½ΠΎ ΠΈΠ»ΠΈ късно Ρ‰Π΅ сС Π·Π°Π΄ΡƒΡˆΠΈ ΠΈ Ρ‰Π΅ трябва Π΄Π° Π³ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚Π΅ Π³Ρ€ΠΎΠ·Π½ΠΎ. Искам Π΄Π° ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°ΠΌ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, просто Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, Π² Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ ΠΈ Π΄Π° ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π°ΠΌ Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΈ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ заявки Π²ΡŠΡ€Ρ…Ρƒ тях, ΠΊΠ°Ρ‚ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ, Π½ΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Π΅ΠΌΠΈ инструмСнти. И Ρ‰Π΅ ΠΈΠΌΠ° всС ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΈ ΠΏΠΎΠ²Π΅Ρ‡Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈ. И Π΅ ΠΏΠΎ-Π΄ΠΎΠ±Ρ€Π΅ Π΄Π° Ρ€Π°Π·Π±ΠΈΠ΅Ρ‚Π΅ Π½Π΅ двигатСля, Π° ΠΈΠ·Ρ…ΠΎΠ΄Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ. ИмамС Π½ΡƒΠΆΠ΄Π° ΠΎΡ‚ Ρ€Π°Π·ΡˆΠΈΡ€ΡΠ΅ΠΌ ΠΈ унивСрсалСн DataLake, Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅...

Какво Ρ‰Π΅ станС, Π°ΠΊΠΎ ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Ρ‚Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π² ΠΏΠΎΠ·Π½Π°Ρ‚ΠΎΡ‚ΠΎ ΠΈ Π΄ΠΎΠ±Ρ€Π΅ ΠΏΠΎΠ·Π½Π°Ρ‚ΠΎ ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎ ΠΎΠ±Π»Π°Ρ‡Π½ΠΎ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅ Amazon S3, Π±Π΅Π· Π΄Π° сС Π½Π°Π»Π°Π³Π° Π΄Π° приготвятС свои собствСни ΠΏΡŠΡ€ΠΆΠΎΠ»ΠΈ ΠΎΡ‚ Hadoop?

Ясно Π΅, Ρ‡Π΅ Π»ΠΈΡ‡Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ са β€žΠ½ΠΈΡΠΊΠΈβ€œ, Π½ΠΎ ΠΊΠ°ΠΊΠ²ΠΎ Π΄Π° ΠΊΠ°ΠΆΠ΅ΠΌ Π·Π° Π΄Ρ€ΡƒΠ³ΠΈ Π΄Π°Π½Π½ΠΈ, Π°ΠΊΠΎ Π³ΠΈ ΠΈΠ·Π²Π°Π΄ΠΈΠΌ Ρ‚Π°ΠΌ ΠΈ Π³ΠΈ β€žΡƒΠΏΡ€Π°Π²Π»ΡΠ²Π°ΠΌΠ΅ Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎβ€œ?

Cluster-bigdata-analytics СкосистСма Π½Π° Amazon Web Services - с ΠΌΠ½ΠΎΠ³ΠΎ прости Π΄ΡƒΠΌΠΈ

БъдСйки ΠΏΠΎ нашия ΠΎΠΏΠΈΡ‚ с AWS, Apache Hadoop/MapReduce сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ Ρ‚Π°ΠΌ ΠΎΡ‚ дълго Π²Ρ€Π΅ΠΌΠ΅ ΠΏΠΎΠ΄ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ сосовС, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π² услугата DataPipeline (Π·Π°Π²ΠΈΠΆΠ΄Π°ΠΌ Π½Π° ΠΊΠΎΠ»Π΅Π³ΠΈΡ‚Π΅ си, Ρ‚Π΅ сС Π½Π°ΡƒΡ‡ΠΈΡ…Π° ΠΊΠ°ΠΊ Π΄Π° Π³ΠΎ подготвят ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ). Π’ΡƒΠΊ настройвамС Ρ€Π΅Π·Π΅Ρ€Π²Π½ΠΈ копия ΠΎΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ услуги ΠΎΡ‚ DynamoDB Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ:
Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

И Ρ‚Π΅ работят Ρ€Π΅Π΄ΠΎΠ²Π½ΠΎ Π½Π° Π²Π³Ρ€Π°Π΄Π΅Π½ΠΈ Hadoop/MapReduce ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ΠΈ ΠΊΠ°Ρ‚ΠΎ часовник Π²Π΅Ρ‡Π΅ няколко Π³ΠΎΠ΄ΠΈΠ½ΠΈ. β€žΠΠ°ΡΡ‚Ρ€ΠΎΠΉΡ‚Π΅ ΠΈ Π·Π°Π±Ρ€Π°Π²Π΅Ρ‚Π΅β€œ:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

ΠœΠΎΠΆΠ΅Ρ‚Π΅ ΡΡŠΡ‰ΠΎ Ρ‚Π°ΠΊΠ° Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π΄Π° сС Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅ Π² сатанизма Π½Π° Π΄Π°Π½Π½ΠΈΡ‚Π΅, ΠΊΠ°Ρ‚ΠΎ настроитС Π»Π°ΠΏΡ‚ΠΎΠΏΠΈ Jupiter Π² ΠΎΠ±Π»Π°ΠΊΠ° Π·Π° Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΈ ΠΈ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚Π΅ услугата AWS SageMaker Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈ внСдряванС Π½Π° AI ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² Π±ΠΈΡ‚ΠΊΠ°. Π•Ρ‚ΠΎ ΠΊΠ°ΠΊ ΠΈΠ·Π³Π»Π΅ΠΆΠ΄Π° ΠΏΡ€ΠΈ нас:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

И Π΄Π°, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΈΠ·Π±Π΅Ρ€Π΅Ρ‚Π΅ Π»Π°ΠΏΡ‚ΠΎΠΏ Π·Π° сСбС си ΠΈΠ»ΠΈ Π·Π° Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ Π² ΠΎΠ±Π»Π°ΠΊΠ° ΠΈ Π΄Π° Π³ΠΎ ΠΏΡ€ΠΈΠΊΠ°Ρ‡ΠΈΡ‚Π΅ към Hadoop/Spark ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€, Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ изчислСнията ΠΈ слСд Ρ‚ΠΎΠ²Π° Π΄Π° Π·Π°ΠΊΠΎΠ²Π°Ρ‚Π΅ всичко:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Наистина ΡƒΠ΄ΠΎΠ±Π½ΠΎ Π·Π° ΠΈΠ½Π΄ΠΈΠ²ΠΈΠ΄ΡƒΠ°Π»Π½ΠΈ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈ ΠΈ Π·Π° някои ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ услугата EMR Π·Π° ΠΌΠ°Ρ‰Π°Π±Π½ΠΈ изчислСния ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈ. Какво Ρ‰Π΅ ΠΊΠ°ΠΆΠ΅Ρ‚Π΅ Π·Π° систСмно Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π·Π° DataLake, Ρ‰Π΅ Ρ€Π°Π±ΠΎΡ‚ΠΈ Π»ΠΈ? Π’ Ρ‚ΠΎΠ·ΠΈ ΠΌΠΎΠΌΠ΅Π½Ρ‚ бяхмС Π½Π° Ρ€ΡŠΠ±Π° Π½Π° Π½Π°Π΄Π΅ΠΆΠ΄Π°Ρ‚Π° ΠΈ отчаяниСто ΠΈ ΠΏΡ€ΠΎΠ΄ΡŠΠ»ΠΆΠΈΡ…ΠΌΠ΅ Ρ‚ΡŠΡ€ΡΠ΅Π½Π΅Ρ‚ΠΎ.

AWS Glue - Π΄ΠΎΠ±Ρ€Π΅ ΠΎΠΏΠ°ΠΊΠΎΠ²Π°Π½ Apache Spark Π½Π° стСроиди

Оказа сС, Ρ‡Π΅ AWS ΠΈΠΌΠ° собствСна вСрсия Π½Π° стСка β€œHive/Pig/Spark”. Ролята Π½Π° Hive, Ρ‚.Π΅. ΠšΠ°Ρ‚Π°Π»ΠΎΠ³ΡŠΡ‚ Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅Ρ‚Π΅ ΠΈ Ρ‚Π΅Ρ…Π½ΠΈΡ‚Π΅ Ρ‚ΠΈΠΏΠΎΠ²Π΅ Π² DataLake сС ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π° ΠΎΡ‚ услугата β€žΠšΠ°Ρ‚Π°Π»ΠΎΠ³ Π½Π° Π΄Π°Π½Π½ΠΈβ€œ, която Π½Π΅ ΠΊΡ€ΠΈΠ΅ ΡΡŠΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚Ρ‚Π° си с Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Apache Hive. Врябва Π΄Π° Π΄ΠΎΠ±Π°Π²ΠΈΡ‚Π΅ информация към Ρ‚Π°Π·ΠΈ услуга Π·Π° Ρ‚ΠΎΠ²Π° къдС сС Π½Π°ΠΌΠΈΡ€Π°Ρ‚ Π²Π°ΡˆΠΈΡ‚Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΈ Π² какъв Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ са. Π”Π°Π½Π½ΠΈΡ‚Π΅ ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° Π±ΡŠΠ΄Π°Ρ‚ Π½Π΅ само Π² s3, Π½ΠΎ ΠΈ Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ, Π½ΠΎ Ρ‚ΠΎΠ²Π° Π½Π΅ Π΅ ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚ Π½Π° Ρ‚Π°Π·ΠΈ публикация. Π•Ρ‚ΠΎ ΠΊΠ°ΠΊ Π΅ ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Π½Π° Π½Π°ΡˆΠ°Ρ‚Π° дирСктория с Π΄Π°Π½Π½ΠΈ DataLake:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Π€Π°ΠΉΠ»ΠΎΠ²Π΅Ρ‚Π΅ са рСгистрирани, супСр. Ако Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅Ρ‚Π΅ са Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Π½ΠΈ, стартирамС Ρ€ΠΎΠ±ΠΎΡ‚ΠΈ ΠΈΠ»ΠΈ Ρ€ΡŠΡ‡Π½ΠΎ, ΠΈΠ»ΠΈ ΠΏΠΎ Π³Ρ€Π°Ρ„ΠΈΠΊ, ΠΊΠΎΠΈΡ‚ΠΎ Ρ‰Π΅ Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚ информацията Π·Π° тях ΠΎΡ‚ Π΅Π·Π΅Ρ€ΠΎΡ‚ΠΎ ΠΈ Ρ‰Π΅ Π³ΠΈ запазят. Π‘Π»Π΅Π΄ Ρ‚ΠΎΠ²Π° Π΄Π°Π½Π½ΠΈΡ‚Π΅ ΠΎΡ‚ Π΅Π·Π΅Ρ€ΠΎΡ‚ΠΎ ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° Π±ΡŠΠ΄Π°Ρ‚ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π΅Π½ΠΈ ΠΈ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΈΡ‚Π΅ Π΄Π° Π±ΡŠΠ΄Π°Ρ‚ ΠΊΠ°Ρ‡Π΅Π½ΠΈ някъдС. Π’ Π½Π°ΠΉ-простия случай ΠΊΠ°Ρ‡Π²Π°ΠΌΠ΅ ΠΈ Π½Π° s3. ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°Ρ‚Π° Π½Π° Π΄Π°Π½Π½ΠΈ ΠΌΠΎΠΆΠ΅ Π΄Π° сС ΠΈΠ·Π²ΡŠΡ€ΡˆΠΈ навсякъдС, Π½ΠΎ сС ΠΏΡ€Π΅ΠΏΠΎΡ€ΡŠΡ‡Π²Π° Π΄Π° ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€ΠΈΡ€Π°Ρ‚Π΅ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°Ρ‚Π° Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ Apache Spark, ΠΊΠ°Ρ‚ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚Π΅ Ρ€Π°Π·ΡˆΠΈΡ€Π΅Π½ΠΈ Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΠΈ Ρ‡Ρ€Π΅Π· AWS Glue API. Π’ΡΡŠΡ‰Π½ΠΎΡΡ‚ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ добрия стар ΠΈ ΠΏΠΎΠ·Π½Π°Ρ‚ ΠΊΠΎΠ΄ Π½Π° Python с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° pyspark ΠΈ Π΄Π° ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€ΠΈΡ€Π°Ρ‚Π΅ ΠΈΠ·ΠΏΡŠΠ»Π½Π΅Π½ΠΈΠ΅Ρ‚ΠΎ ΠΌΡƒ Π½Π° N възли Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ с извСстСн ΠΊΠ°ΠΏΠ°Ρ†ΠΈΡ‚Π΅Ρ‚ с наблюдСниС, Π±Π΅Π· Π΄Π° Ρ€ΠΎΠ²ΠΈΡ‚Π΅ Π² Ρ‡Π΅Ρ€Π²Π°Ρ‚Π° Π½Π° Hadoop ΠΈ Π΄Π° Π²Π»Π°Ρ‡ΠΈΡ‚Π΅ ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ΠΈ docker-moker ΠΈ Π΄Π° Π΅Π»ΠΈΠΌΠΈΠ½ΠΈΡ€Π°Ρ‚Π΅ ΠΊΠΎΠ½Ρ„Π»ΠΈΠΊΡ‚ΠΈ Π½Π° зависимости .

ΠžΡ‰Π΅ вСднъТ, проста идСя. Няма Π½ΡƒΠΆΠ΄Π° Π΄Π° ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€ΠΈΡ€Π°Ρ‚Π΅ Apache Spark, просто трябва Π΄Π° Π½Π°ΠΏΠΈΡˆΠ΅Ρ‚Π΅ ΠΊΠΎΠ΄ Π½Π° python Π·Π° pyspark, Π΄Π° Π³ΠΎ тСстватС Π»ΠΎΠΊΠ°Π»Π½ΠΎ Π½Π° вашия Ρ€Π°Π±ΠΎΡ‚Π΅Π½ ΠΏΠ»ΠΎΡ‚ ΠΈ слСд Ρ‚ΠΎΠ²Π° Π΄Π° Π³ΠΎ стартиратС Π½Π° голям ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ Π² ΠΎΠ±Π»Π°ΠΊΠ°, ΠΊΠ°Ρ‚ΠΎ посочитС къдС са ΠΈΠ·Ρ…ΠΎΠ΄Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ ΠΈ къдС Π΄Π° поставитС Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π°. Понякога Ρ‚ΠΎΠ²Π° Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΈ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΈ Π΅Ρ‚ΠΎ ΠΊΠ°ΠΊ Π³ΠΎ настройвамС:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

По Ρ‚ΠΎΠ·ΠΈ Π½Π°Ρ‡ΠΈΠ½, Π°ΠΊΠΎ трябва Π΄Π° изчислитС Π½Π΅Ρ‰ΠΎ Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ Π½Π° Spark, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ Π΄Π°Π½Π½ΠΈ Π² s3, Π½ΠΈΠ΅ пишСм ΠΊΠΎΠ΄ Π½Π° python/pyspark, тСствамС Π³ΠΎ ΠΈ ΠΆΠ΅Π»Π°Π΅ΠΌ успСх Π½Π° ΠΎΠ±Π»Π°ΠΊΠ°.

Какво Ρ‰Π΅ ΠΊΠ°ΠΆΠ΅Ρ‚Π΅ Π·Π° оркСстрацията? Ами Π°ΠΊΠΎ Π·Π°Π΄Π°Ρ‡Π°Ρ‚Π° ΠΏΠ°Π΄Π½Π΅ ΠΈ ΠΈΠ·Ρ‡Π΅Π·Π½Π΅? Π”Π°, ΠΏΡ€Π΅Π΄Π»Π°Π³Π° сС Π΄Π° сС Π½Π°ΠΏΡ€Π°Π²ΠΈ красив ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€ Π² стила Π½Π° Apache Pig ΠΈ Π½ΠΈΠ΅ Π΄ΠΎΡ€ΠΈ Π³ΠΈ ΠΎΠΏΠΈΡ‚Π°Ρ…ΠΌΠ΅, Π½ΠΎ засСга Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ Π½Π°ΡˆΠ°Ρ‚Π° дълбоко пСрсонализирана оркСстрация Π² PHP ΠΈ JavaScript (Ρ€Π°Π·Π±ΠΈΡ€Π°ΠΌ, ΠΈΠΌΠ° ΠΊΠΎΠ³Π½ΠΈΡ‚ΠΈΠ²Π΅Π½ дисонанс, Π½ΠΎ Ρ€Π°Π±ΠΎΡ‚ΠΈ, Π·Π° Π³ΠΎΠ΄ΠΈΠ½ΠΈ ΠΈ Π±Π΅Π· Π³Ρ€Π΅ΡˆΠΊΠΈ).

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Π€ΠΎΡ€ΠΌΠ°Ρ‚ΡŠΡ‚ Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅Ρ‚Π΅, ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Π½ΠΈ Π² Π΅Π·Π΅Ρ€ΠΎΡ‚ΠΎ, Π΅ ΠΊΠ»ΡŽΡ‡ΡŠΡ‚ към производитСлността

Много, ΠΌΠ½ΠΎΠ³ΠΎ Π²Π°ΠΆΠ½ΠΎ Π΅ Π΄Π° Ρ€Π°Π·Π±Π΅Ρ€Π΅Ρ‚Π΅ ΠΎΡ‰Π΅ Π΄Π²Π΅ ΠΊΠ»ΡŽΡ‡ΠΎΠ²ΠΈ Ρ‚ΠΎΡ‡ΠΊΠΈ. Π—Π° Π΄Π° ΠΌΠΎΠ³Π°Ρ‚ заявкитС Π·Π° Ρ„Π°ΠΉΠ»ΠΎΠ²ΠΈ Π΄Π°Π½Π½ΠΈ Π² Π΅Π·Π΅Ρ€ΠΎΡ‚ΠΎ Π΄Π° сС ΠΈΠ·ΠΏΡŠΠ»Π½ΡΠ²Π°Ρ‚ възмоТно Π½Π°ΠΉ-Π±ΡŠΡ€Π·ΠΎ ΠΈ производитСлността Π΄Π° Π½Π΅ сС влошава ΠΏΡ€ΠΈ добавянС Π½Π° Π½ΠΎΠ²Π° информация, трябва Π΄Π°:

  • Π‘ΡŠΡ…Ρ€Π°Π½ΡΠ²Π°ΠΉΡ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΎΡ‚ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΎΡ‚Π΄Π΅Π»Π½ΠΎ (Π·Π° Π΄Π° Π½Π΅ сС Π½Π°Π»Π°Π³Π° Π΄Π° Ρ‡Π΅Ρ‚Π΅Ρ‚Π΅ всички Ρ€Π΅Π΄ΠΎΠ²Π΅, Π·Π° Π΄Π° Ρ€Π°Π·Π±Π΅Ρ€Π΅Ρ‚Π΅ ΠΊΠ°ΠΊΠ²ΠΎ ΠΈΠΌΠ° Π² ΠΊΠΎΠ»ΠΎΠ½ΠΈΡ‚Π΅). Π—Π° Ρ‚ΠΎΠ²Π° Π²Π·Π΅Ρ…ΠΌΠ΅ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° ΠΏΠ°Ρ€ΠΊΠ΅Ρ‚Π° с компрСсия
  • Много Π΅ Π²Π°ΠΆΠ½ΠΎ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅Ρ‚Π΅ Π΄Π° сС раздСлят Π² ΠΏΠ°ΠΏΠΊΠΈ ΠΊΠ°Ρ‚ΠΎ: Π΅Π·ΠΈΠΊ, Π³ΠΎΠ΄ΠΈΠ½Π°, мСсСц, Π΄Π΅Π½, сСдмица. ΠœΠ°ΡˆΠΈΠ½ΠΈΡ‚Π΅, ΠΊΠΎΠΈΡ‚ΠΎ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ Ρ‚ΠΎΠ·ΠΈ Ρ‚ΠΈΠΏ ΡˆΠ°Ρ€Π΄ΠΈΠ½Π³, Ρ‰Π΅ Ρ€Π°Π·Π³Π»Π΅ΠΆΠ΄Π°Ρ‚ само Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈΡ‚Π΅ ΠΏΠ°ΠΏΠΊΠΈ, Π±Π΅Π· Π΄Π° прСсяват всички Π΄Π°Π½Π½ΠΈ ΠΏΠΎΠ΄Ρ€Π΅Π΄.

По ΡΡŠΡ‰Π΅ΡΡ‚Π²ΠΎ ΠΏΠΎ Ρ‚ΠΎΠ·ΠΈ Π½Π°Ρ‡ΠΈΠ½ Π²ΠΈΠ΅ ΠΈΠ·Π»Π°Π³Π°Ρ‚Π΅ ΠΈΠ·Ρ…ΠΎΠ΄Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ Π² Π½Π°ΠΉ-Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½Π°Ρ‚Π° Ρ„ΠΎΡ€ΠΌΠ° Π·Π° Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π½ΠΈ машини, ΠΎΠΊΠ°Ρ‡Π΅Π½ΠΈ ΠΎΡ‚Π³ΠΎΡ€Π΅, ΠΊΠΎΠΈΡ‚ΠΎ Π΄ΠΎΡ€ΠΈ Π² ΡˆΠ°Ρ€Π΄ΠΈΡ€Π°Π½ΠΈ ΠΏΠ°ΠΏΠΊΠΈ ΠΌΠΎΠ³Π°Ρ‚ ΠΈΠ·Π±ΠΈΡ€Π°Ρ‚Π΅Π»Π½ΠΎ Π΄Π° Π²Π»ΠΈΠ·Π°Ρ‚ ΠΈ Ρ‡Π΅Ρ‚Π°Ρ‚ само Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈΡ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΎΡ‚ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅. НС Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π΄Π° β€žΠΏΠΎΠΏΡŠΠ»Π²Π°Ρ‚Π΅β€œ Π΄Π°Π½Π½ΠΈΡ‚Π΅ никъдС (Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅Ρ‚ΠΎ просто Ρ‰Π΅ сС спука) - просто Π²Π΅Π΄Π½Π°Π³Π° Π³ΠΎ поставСтС Ρ€Π°Π·ΡƒΠΌΠ½ΠΎ във Ρ„Π°ΠΉΠ»ΠΎΠ²Π°Ρ‚Π° систСма Π² правилния Ρ„ΠΎΡ€ΠΌΠ°Ρ‚. Π Π°Π·Π±ΠΈΡ€Π° сС, Ρ‚ΡƒΠΊ трябва Π΄Π° Π΅ ясно, Ρ‡Π΅ ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Π½Π΅Ρ‚ΠΎ Π½Π° ΠΎΠ³Ρ€ΠΎΠΌΠ΅Π½ csv Ρ„Π°ΠΉΠ» Π² DataLake, ΠΊΠΎΠΉΡ‚ΠΎ ΠΏΡŠΡ€Π²ΠΎ трябва Π΄Π° бъдС ΠΏΡ€ΠΎΡ‡Π΅Ρ‚Π΅Π½ Ρ€Π΅Π΄ ΠΏΠΎ Ρ€Π΅Π΄ ΠΎΡ‚ ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€Π°, Π·Π° Π΄Π° сС ΠΈΠ·Π²Π»Π΅ΠΊΠ°Ρ‚ ΠΊΠΎΠ»ΠΎΠ½ΠΈΡ‚Π΅, Π½Π΅ Π΅ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€Π΅ΠΏΠΎΡ€ΡŠΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ. ΠŸΠΎΠΌΠΈΡΠ»Π΅Ρ‚Π΅ ΠΎΡ‚Π½ΠΎΠ²ΠΎ Π·Π° Π³ΠΎΡ€Π½ΠΈΡ‚Π΅ Π΄Π²Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ, Π°ΠΊΠΎ всС ΠΎΡ‰Π΅ Π½Π΅ Π΅ ясно Π·Π°Ρ‰ΠΎ сС случва всичко Ρ‚ΠΎΠ²Π°.

AWS Athena - ΠΆΠ°ΠΊ Π² кутията

И Ρ‚ΠΎΠ³Π°Π²Π°, Π΄ΠΎΠΊΠ°Ρ‚ΠΎ ΡΡŠΠ·Π΄Π°Π²Π°Ρ…ΠΌΠ΅ Π΅Π·Π΅Ρ€ΠΎ, ΠΏΠΎ някакъв Π½Π°Ρ‡ΠΈΠ½ случайно ΠΏΠΎΠΏΠ°Π΄Π½Π°Ρ…ΠΌΠ΅ Π½Π° Amazon Athena. ИзвСднъТ сС ΠΎΠΊΠ°Π·Π°, Ρ‡Π΅ Ρ‡Ρ€Π΅Π· Π²Π½ΠΈΠΌΠ°Ρ‚Π΅Π»Π½ΠΎ ΠΏΠΎΠ΄Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π½Π°ΡˆΠΈΡ‚Π΅ ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΈ рСгистрационни Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π² сСгмСнти Π½Π° ΠΏΠ°ΠΏΠΊΠΈ Π² правилния (ΠΏΠ°Ρ€ΠΊΠ΅Ρ‚Π΅Π½) Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ Π½Π° ΠΊΠΎΠ»ΠΎΠ½ΠΈ, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΌΠ½ΠΎΠ³ΠΎ Π±ΡŠΡ€Π·ΠΎ Π΄Π° Π½Π°ΠΏΡ€Π°Π²ΠΈΡ‚Π΅ ΠΈΠ·ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½ΠΈ сСлСкции ΠΎΡ‚ тях ΠΈ Π΄Π° ΠΈΠ·Π³Ρ€Π°Π΄ΠΈΡ‚Π΅ ΠΎΡ‚Ρ‡Π΅Ρ‚ΠΈ Π‘Π•Π—, Π±Π΅Π· Apache Spark/Glue ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€.

Π•Π½Π΄ΠΆΠΈΠ½ΡŠΡ‚ Athena, Π·Π°Π΄Π²ΠΈΠΆΠ²Π°Π½ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ Π² s3, Π΅ Π±Π°Π·ΠΈΡ€Π°Π½ Π½Π° лСгСндарния ΠŸΡ€Π΅ΡΡ‚ΠΎ - прСдставитСл Π½Π° сСмСйството ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈ Π·Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π½Π° Π΄Π°Π½Π½ΠΈ MPP (масивна ΠΏΠ°Ρ€Π°Π»Π΅Π»Π½Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ°), ΠΊΠ°Ρ‚ΠΎ Π²Π·Π΅ΠΌΠ° Π΄Π°Π½Π½ΠΈ Ρ‚Π°ΠΌ, ΠΊΡŠΠ΄Π΅Ρ‚ΠΎ сС Π½Π°ΠΌΠΈΡ€Π°Ρ‚, ΠΎΡ‚ s3 ΠΈ Hadoop Π΄ΠΎ Cassandra ΠΈ ΠΎΠ±ΠΈΠΊΠ½ΠΎΠ²Π΅Π½ΠΈ тСкстови Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅. ΠŸΡ€ΠΎΡΡ‚ΠΎ трябва Π΄Π° ΠΏΠΎΠΌΠΎΠ»ΠΈΡ‚Π΅ Athena Π΄Π° изпълни SQL заявка ΠΈ Ρ‚ΠΎΠ³Π°Π²Π° всичко β€žΡ€Π°Π±ΠΎΡ‚ΠΈ Π±ΡŠΡ€Π·ΠΎ ΠΈ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎβ€œ. Π’Π°ΠΆΠ½ΠΎ Π΅ Π΄Π° сС ΠΎΡ‚Π±Π΅Π»Π΅ΠΆΠΈ, Ρ‡Π΅ Athena Π΅ β€žΡƒΠΌΠ½Π°β€œ, тя ΠΎΡ‚ΠΈΠ²Π° само Π΄ΠΎ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈΡ‚Π΅ ΡˆΠ°Ρ€Π΄ΠΈΡ€Π°Π½ΠΈ ΠΏΠ°ΠΏΠΊΠΈ ΠΈ Ρ‡Π΅Ρ‚Π΅ само ΠΊΠΎΠ»ΠΎΠ½ΠΈΡ‚Π΅, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈ Π² заявката.

Π¦Π΅Π½ΠΎΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅Ρ‚ΠΎ Π·Π° заявки към Athena ΡΡŠΡ‰ΠΎ Π΅ интСрСсно. НиС ΠΏΠ»Π°Ρ‰Π°ΠΌΠ΅ Π·Π° ΠΎΠ±Π΅ΠΌ сканирани Π΄Π°Π½Π½ΠΈ. Π’Π΅Π·ΠΈ. Π½Π΅ Π·Π° броя Π½Π° ΠΌΠ°ΡˆΠΈΠ½ΠΈΡ‚Π΅ Π² ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€Π° Π½Π° ΠΌΠΈΠ½ΡƒΡ‚Π°, Π½ΠΎ... Π·Π° дСйствитСлно сканиранитС Π΄Π°Π½Π½ΠΈ Π½Π° 100-500 машини, само Π΄Π°Π½Π½ΠΈΡ‚Π΅, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈ Π·Π° изпълнСниС Π½Π° заявката.

И ΠΊΠ°Ρ‚ΠΎ поискахмС само Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈΡ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΎΡ‚ ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ ΡˆΠ°Ρ€Π΄ΠΈΡ€Π°Π½ΠΈ ΠΏΠ°ΠΏΠΊΠΈ, сС ΠΎΠΊΠ°Π·Π°, Ρ‡Π΅ услугата Athena Π½ΠΈ струва дСсСтки Π΄ΠΎΠ»Π°Ρ€ΠΈ Π½Π° мСсСц. Π•, страхотно, ΠΏΠΎΡ‡Ρ‚ΠΈ Π±Π΅Π·ΠΏΠ»Π°Ρ‚Π½ΠΎ, Π² сравнСниС с Π°Π½Π°Π»ΠΈΠ·Π° Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ΠΈ!

ΠœΠ΅ΠΆΠ΄Ρƒ Π΄Ρ€ΡƒΠ³ΠΎΡ‚ΠΎ, Π΅Ρ‚ΠΎ ΠΊΠ°ΠΊ сподСлямС Π½Π°ΡˆΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ Π² s3:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Π’ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Π½Π° Ρ‚ΠΎΠ²Π° Π·Π° ΠΊΡ€Π°Ρ‚ΠΊΠΎ Π²Ρ€Π΅ΠΌΠ΅ напълно Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΎΡ‚Π΄Π΅Π»ΠΈ Π² компанията, ΠΎΡ‚ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Π° сигурност Π΄ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈ, Π·Π°ΠΏΠΎΡ‡Π½Π°Ρ…Π° Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π΄Π° отправят заявки към Athena ΠΈ Π±ΡŠΡ€Π·ΠΎ, Π·Π° сСкунди, Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡Π°Π²Π°Ρ‚ ΠΏΠΎΠ»Π΅Π·Π½ΠΈ ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ΠΈ ΠΎΡ‚ β€žΠ³ΠΎΠ»Π΅ΠΌΠΈβ€œ Π΄Π°Π½Π½ΠΈ Π·Π° доста дълги ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ΠΈ: мСсСци, ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½ Π³ΠΎΠ΄ΠΈΠ½Π° ΠΈ Π΄Ρ€. П.

Но Π½ΠΈΠ΅ ΠΎΡ‚ΠΈΠ΄ΠΎΡ…ΠΌΠ΅ ΠΏΠΎ-Π΄Π°Π»Π΅Ρ‡ ΠΈ Π·Π°ΠΏΠΎΡ‡Π½Π°Ρ…ΠΌΠ΅ Π΄Π° ΠΎΡ‚ΠΈΠ²Π°ΠΌΠ΅ Π² ΠΎΠ±Π»Π°ΠΊΠ° Π·Π° ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ΠΈ Ρ‡Ρ€Π΅Π· ODBC Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€: Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ пишС SQL заявка Π² ΠΏΠΎΠ·Π½Π°Ρ‚Π° ΠΊΠΎΠ½Π·ΠΎΠ»Π°, която Π½Π° 100-500 машини β€žΠ·Π° ΡΡ‚ΠΎΡ‚ΠΈΠ½ΠΊΠΈβ€œ ΠΈΠ·ΠΏΡ€Π°Ρ‰Π° Π΄Π°Π½Π½ΠΈ Π΄ΠΎ s3 ΠΈ Π²Ρ€ΡŠΡ‰Π° ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ ΠΎΠ±ΠΈΠΊΠ½ΠΎΠ²Π΅Π½ΠΎ слСд няколко сСкунди. Π£Π΄ΠΎΠ±Π΅Π½. И Π±ΡŠΡ€Π·ΠΎ. ΠžΡ‰Π΅ Π½Π΅ ΠΌΠΎΠ³Π° Π΄Π° повярвам.

Π’ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Π½Π° Ρ‚ΠΎΠ²Π°, слСд ΠΊΠ°Ρ‚ΠΎ Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°ΠΌΠ΅ Π΄Π°Π½Π½ΠΈ Π² s3, Π² Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π΅Π½ ΠΊΠΎΠ»ΠΎΠ½Π΅Π½ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ ΠΈ с Ρ€Π°Π·ΡƒΠΌΠ½ΠΎ ΡˆΠ°Ρ€Π΄ΠΈΠ½Π³ Π½Π° Π΄Π°Π½Π½ΠΈΡ‚Π΅ Π² ΠΏΠ°ΠΏΠΊΠΈ... ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ…ΠΌΠ΅ DataLake ΠΈ Π±ΡŠΡ€Π· ΠΈ Π΅Π²Ρ‚ΠΈΠ½ Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡Π΅Π½ Π΄Π²ΠΈΠ³Π°Ρ‚Π΅Π» - Π±Π΅Π·ΠΏΠ»Π°Ρ‚Π½ΠΎ. И Ρ‚ΠΎΠΉ стана ΠΌΠ½ΠΎΠ³ΠΎ популярСн Π² компанията, Π·Π°Ρ‰ΠΎΡ‚ΠΎ... Ρ€Π°Π·Π±ΠΈΡ€Π° SQL ΠΈ Ρ€Π°Π±ΠΎΡ‚ΠΈ с ΠΏΠΎΡ€ΡΠ΄ΡŠΡ†ΠΈ ΠΏΠΎ-Π±ΡŠΡ€Π·ΠΎ, ΠΎΡ‚ΠΊΠΎΠ»ΠΊΠΎΡ‚ΠΎ Ρ‡Ρ€Π΅Π· стартиранС/спиранС/настройванС Π½Π° ΠΊΠ»ΡŠΡΡ‚Π΅Ρ€ΠΈ. β€žΠ˜ Π°ΠΊΠΎ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΡŠΡ‚ Π΅ ΡΡŠΡ‰ΠΈΡΡ‚, Π·Π°Ρ‰ΠΎ Π΄Π° ΠΏΠ»Π°Ρ‰Π°ΠΌΠ΅ ΠΏΠΎΠ²Π΅Ρ‡Π΅?β€œ

Молба към Атина ΠΈΠ·Π³Π»Π΅ΠΆΠ΄Π° Ρ‚Π°ΠΊΠ°. ΠŸΡ€ΠΈ ΠΆΠ΅Π»Π°Π½ΠΈΠ΅, Ρ€Π°Π·Π±ΠΈΡ€Π° сС, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΎΡ„ΠΎΡ€ΠΌΠΈΡ‚Π΅ Π΄ΠΎΡΡ‚Π°Ρ‚ΡŠΡ‡Π½ΠΎ слоТна ΠΈ многостранична SQL заявка, Π½ΠΎ Ρ‰Π΅ сС ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠΌ Π΄ΠΎ ΠΎΠ±ΠΈΠΊΠ½ΠΎΠ²Π΅Π½ΠΎ Π³Ρ€ΡƒΠΏΠΈΡ€Π°Π½Π΅. НСка Π΄Π° Π²ΠΈΠ΄ΠΈΠΌ ΠΊΠ°ΠΊΠ²ΠΈ ΠΊΠΎΠ΄ΠΎΠ²Π΅ Π½Π° ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ имашС ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΡŠΡ‚ ΠΏΡ€Π΅Π΄ΠΈ няколко сСдмици Π² рСгистрационнитС Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π½Π° ΡƒΠ΅Π± ΡΡŠΡ€Π²ΡŠΡ€Π° ΠΈ Π΄Π° сС ΡƒΠ²Π΅Ρ€ΠΈΠΌ, Ρ‡Π΅ няма Π³Ρ€Π΅ΡˆΠΊΠΈ:

Как ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ високоСфСктивСн ΠΈ Π΅Π²Ρ‚ΠΈΠ½ DataLake ΠΈ Π·Π°Ρ‰ΠΎ

Π”Π°Π½Π½ΠΈ

Π‘Π»Π΅Π΄ ΠΊΠ°Ρ‚ΠΎ ΠΏΡ€Π΅ΠΌΠΈΠ½Π°Ρ…ΠΌΠ΅ ΠΏΡ€Π΅Π·, Π΄Π° Π½Π΅ ΠΊΠ°ΠΆΠ΅ΠΌ, дълъг, Π½ΠΎ Π±ΠΎΠ»Π΅Π·Π½Π΅Π½ ΠΏΡŠΡ‚, постоянно Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½ΠΎ оцСнявайки рисковСтС ΠΈ Π½ΠΈΠ²ΠΎΡ‚ΠΎ Π½Π° слоТност ΠΈ Ρ†Π΅Π½Π°Ρ‚Π° Π½Π° ΠΏΠΎΠ΄Π΄Ρ€ΡŠΠΆΠΊΠ°Ρ‚Π°, Π½Π°ΠΌΠ΅Ρ€ΠΈΡ…ΠΌΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π·Π° DataLake ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈ, ΠΊΠΎΠ΅Ρ‚ΠΎ Π½Π΅ спира Π΄Π° Π½ΠΈ Ρ€Π°Π΄Π²Π° ΠΊΠ°ΠΊΡ‚ΠΎ със скорост, Ρ‚Π°ΠΊΠ° ΠΈ с Ρ†Π΅Π½Π° Π½Π° ΠΏΡ€ΠΈΡ‚Π΅ΠΆΠ°Π½ΠΈΠ΅.

Оказа сС, Ρ‡Π΅ ΠΈΠ·Π³Ρ€Π°ΠΆΠ΄Π°Π½Π΅Ρ‚ΠΎ Π½Π° Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π΅Π½, Π±ΡŠΡ€Π· ΠΈ Π΅Π²Ρ‚ΠΈΠ½ Π·Π° Ρ€Π°Π±ΠΎΡ‚Π° DataLake Π·Π° Π½ΡƒΠΆΠ΄ΠΈΡ‚Π΅ Π½Π° напълно Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΎΡ‚Π΄Π΅Π»ΠΈ Π½Π° компанията Π΅ напълно ΠΏΠΎ силитС Π΄ΠΎΡ€ΠΈ Π½Π° ΠΎΠΏΠΈΡ‚Π½ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ Π½ΠΈΠΊΠΎΠ³Π° Π½Π΅ са Ρ€Π°Π±ΠΎΡ‚ΠΈΠ»ΠΈ ΠΊΠ°Ρ‚ΠΎ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΠΈ ΠΈ Π½Π΅ знаят ΠΊΠ°ΠΊ Π΄Π° рисуват ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈ Π²ΡŠΡ€Ρ…Ρƒ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈ с стрСлки ΠΈ Π΄Π° Π·Π½Π°Π΅Ρ‚Π΅ 50 Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π° ΠΎΡ‚ СкосистСмата Hadoop.

Π’ Π½Π°Ρ‡Π°Π»ΠΎΡ‚ΠΎ Π½Π° ΠΏΡŠΡ‚ΡƒΠ²Π°Π½Π΅Ρ‚ΠΎ Π³Π»Π°Π²Π°Ρ‚Π° ΠΌΠΈ сС Ρ†Π΅ΠΏΠ΅ΡˆΠ΅ ΠΎΡ‚ ΠΌΠ½ΠΎΠ³ΠΎΡ‚ΠΎ Π΄ΠΈΠ²ΠΈ Π·ΠΎΠΎΠΏΠ°Ρ€ΠΊΠΎΠ²Π΅ Π½Π° ΠΎΡ‚Π²ΠΎΡ€Π΅Π½ ΠΈ Π·Π°Ρ‚Π²ΠΎΡ€Π΅Π½ софтуСр ΠΈ Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ Π·Π° тСТСстта Π½Π° отговорността към ΠΏΠΎΡ‚ΠΎΠΌΡ†ΠΈΡ‚Π΅. ΠŸΡ€ΠΎΡΡ‚ΠΎ Π·Π°ΠΏΠΎΡ‡Π½Π΅Ρ‚Π΅ Π΄Π° ΠΈΠ·Π³Ρ€Π°ΠΆΠ΄Π°Ρ‚Π΅ своя DataLake ΠΎΡ‚ прости инструмСнти: nagios/munin -> elastic/kibana -> Hadoop/Spark/s3..., ΡΡŠΠ±ΠΈΡ€Π°Π½Π΅ Π½Π° ΠΎΠ±Ρ€Π°Ρ‚Π½Π° Π²Ρ€ΡŠΠ·ΠΊΠ° ΠΈ дълбоко Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅ Π½Π° Ρ„ΠΈΠ·ΠΈΠΊΠ°Ρ‚Π° Π½Π° ΠΏΡ€ΠΎΡ‚ΠΈΡ‡Π°Ρ‰ΠΈΡ‚Π΅ процСси. Всичко слоТно ΠΈ ΠΌΡŠΡ‚Π½ΠΎ - Π΄Π°ΠΉΡ‚Π΅ Π³ΠΎ Π½Π° Π²Ρ€Π°Π³ΠΎΠ²Π΅ ΠΈ ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚ΠΈ.

Ако Π½Π΅ искатС Π΄Π° ΠΎΡ‚ΠΈΠ΄Π΅Ρ‚Π΅ Π² ΠΎΠ±Π»Π°ΠΊΠ° ΠΈ искатС Π΄Π° ΠΏΠΎΠ΄Π΄ΡŠΡ€ΠΆΠ°Ρ‚Π΅, Π°ΠΊΡ‚ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚Π΅ ΠΈ ΠΊΡ€ΡŠΠΏΠ²Π°Ρ‚Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈ с ΠΎΡ‚Π²ΠΎΡ€Π΅Π½ ΠΊΠΎΠ΄, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΈΠ·Π³Ρ€Π°Π΄ΠΈΡ‚Π΅ схСма, ΠΏΠΎΠ΄ΠΎΠ±Π½Π° Π½Π° Π½Π°ΡˆΠ°Ρ‚Π° Π»ΠΎΠΊΠ°Π»Π½ΠΎ, Π½Π° Π΅Π²Ρ‚ΠΈΠ½ΠΈ офис машини с Hadoop ΠΈ Presto ΠΎΡ‚Π³ΠΎΡ€Π΅. ΠžΡΠ½ΠΎΠ²Π½ΠΎΡ‚ΠΎ Π½Π΅Ρ‰ΠΎ Π΅ Π΄Π° Π½Π΅ спиратС ΠΈ Π΄Π° Π²ΡŠΡ€Π²ΠΈΡ‚Π΅ Π½Π°ΠΏΡ€Π΅Π΄, Π΄Π° Π±Ρ€ΠΎΠΈΡ‚Π΅, Π΄Π° Ρ‚ΡŠΡ€ΡΠΈΡ‚Π΅ прости ΠΈ ясни Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΈ всичко ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΎ Ρ‰Π΅ сС ΠΏΠΎΠ»ΡƒΡ‡ΠΈ! УспСх Π½Π° всички ΠΈ Π΄ΠΎ Π½ΠΎΠ²ΠΈ срСщи!

Π˜Π·Ρ‚ΠΎΡ‡Π½ΠΈΠΊ: www.habr.com

ДобавянС Π½Π° Π½ΠΎΠ² ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€