ืื ื ืืืื ืืชืงืืคื ืืืืืื ืฉืื ืืชื ืืืื ืืืืจ ืืืืืจืืช ืืืงืืืช ืืื ืืืื ืืืื ืื ืืงืื ืคืชืื, ืืืืืืจ ืืืชื ืขื "ืืชืืืขื ืืืืื" ืืคื ืืขืฆื ืฉื stackoverflow, ืืืื ืืืชืขืืง ื"ืืืชืืืช ืืจืืืืช", ืืืืคืขืื ืืืชื ืืคืขืืื ืืกืืจืืช. ืืืฉืฆืจืื ืืขืืื/ืืืจืืื ืื ืฉืืืฉืื ืืืชืื ืืืขืืช ืืื ืืืื ืืช - ืืชื ืืืื ืฉืืชืืื ืืืื ืืืื ืจืข ืืืืกืกืืื, ืืื ืืกืชืื ืืฆืืจื ืืจืืืืช ืืื ืืืืจ, ืืื ืืจื ืืืจื, ืืขืชืื ืืขืืจืคื ืืืืื ืืืชืจ, ืืืงืื ืืชืื ืช, ืืืื ืืืืจืื ืืืขืฉืืช ืืืื ื.
ืื ืืืื ืขืืืชืื ืื ืืกืื ืืืชืจ, ืฉืจืืฉืืื ืืจืืขืื ืืืืื ืืืื ืืืจ ืืคืืจืื, ืฉืืงืืื ืืช ืืคืจืืกื ืืืืืจื ืืืคืืื ืฉื ืืืืืืช "ืืืืืืช" ื"ืงืืืืืช" ืืขืฉืจืืช ืฉืจืชืื ื"ืฉืคืืช ืืืคื ืชืืืช" ืขื ืชืืืื ืืืื ืืช ื- ืงืื/ืคืื ืืกืื ืืจืื ื ืื ืืืกื, ืืืื ืืฆื ืืขืืช. ืืื ืืืฉืืืื ืืฉืงื ืืงืจืื ืืืืฉ ืืช "man ps", ืืืชืขืืง ืืงืื ืืืงืืจ ืฉื "nginx" ืขื ืฉืขืื ืืื ืืืืืืช, ืืืืชืื, ืืืชืื, ืืืชืื ืืืืงืืช ืืืืื. ืขืืืชืื ืืืืขืื ืฉืืืืจ ืืืขื ืืื ืืืืชืจ ืืืืข ืืืฉืจ "ืื ืื" ืืื ืืื ืืชืืคื ืืืืื ืืขืจื ืืฉื ื ืืืืฉื. ืืื ืืขืืจื ืจืง ืขื ืืื ืืื ื ืืขืืืงื ืฉื ืืืขื ืฉื ืืื ืืงืก, ืืืืช ืืืฆืืื ืืืฉืื ื ืช ืฉื TCP/IP ืืืืืืจืืชืื ืืืื-ืืืคืืฉ ืืกืืกืืื. ืืืืืืจ ืืช ืืืขืจืืช ืืืืื ืืืื ืฉืืฆืืฆืืืื ืืืื.
ืื ืื, ืงืฆืช ืืืกื ืืขืชื, ืืื ืื ื ืืงืืื ืฉืืฆืืืชื ืืืขืืืจ ืืช ืืฆื ืืฆืืคืืื.
ืืืื ืื ื ืจืืฆื ืืืืืง ืืช ืื ืืกืืื ืฉืื ื ืืคืจืืกืช ืืืกื ืืช ื ืืื ืืืืื ืขืืืจ DataLake, ืืฉืจ ืคืืชืจืช ืืช ืจืื ืืืฉืืืืช ืืื ืืืืืืช ืืืืจื ืขืืืจ ืืืืืืช ืืื ืืืช ืฉืื ืืช ืืืืืืื.
ืืคื ื ืืื ืื ืืืขื ื ืืืื ื ืฉืืืจืืช ืฆืจืืืืช ืืืชืจ ืืืืชืจ ืืช ืืคืืจืืช ืฉื ื ืืชืื ืืืฆืจ ืืืื ื ืืืื (ืฉืื ืืืืจ ืขื ืืืืืืื ืฉืืงืฆืคืช ืืืืืช ืืืืืช ืืืื ื) ืืืื ืืืืื ืืืืืช ืืกืืืื ืื - ืฆืจืื ืืืกืืฃ ืืื ืชื ืขืื ืืขืื ืืืืื.
ื ืืชืื ืืื ื ืืกืืกื ื-Bitrix24
ืืคื ื ืืกืคืจ ืฉื ืื, ืืืงืืื ืืืฉืงืช ืฉืืจืืช Bitrix24, ืืฉืงืขื ื ืืืืคื ืืงืืืื ืืื ืืืฉืืืื ืืืฆืืจืช ืคืืืคืืจืื ืื ืืืืืช ืคืฉืืื ืืืืื ื ืฉืชืขืืืจ ืืจืืืช ืืืืืจืืช ืืขืืืช ืืชืฉืชืืช ืืืชืื ื ืืช ืืฉืื ืืื. ืืืืื ืฉืืื ืืืืืฅ ืืงืืช ืืืื ืืืื ืื ืืื ืฉืืืชืจ ืคืฉืืืื ืืืืื ืื. ืืชืืฆืื ืืื, ื ืืืืืก ื ืืืจ ืื ืืืืจ ื-munin ืื ืืชืื ืืืืืื. ืขืืฉืื ืืฉ ืื ื ืืืคื ืฆ'ืงืื ืื ืืืืก, ืืืืช ืชืจืฉืืืื ืืืื ืื, ืืืงืืืืืช ืฉืื ื ืืฉืชืืฉืื ืืื ืืืฆืืื ืืื ืืื. ืืืืืื ืืจืืจืื, ืืืจืคืื ืืจืืจืื, ืืืขืจืืช ืขืืืืช ืืฆืืจื ืืืื ื ืืืจ ืืื ืฉื ืื ืืืชืืืกืคืื ืื ืืืืคื ืงืืืข ืืืืงืืช ืืืจืคืื ืืืฉืื: ืืฉืื ืื ื ืืื ืืกืื ืฉืืจืืช ืืืฉ ืืคืขืืื, ืืืกืืคืื ืืกืคืจ ืืืืงืืช ืืืจืคืื. ืืืฆืืื.
ืืฆืืข ืขื ืืืืคืง - ื ืืชืื ืืื ื ืืชืงืื
ืืจืฆืื ืืงืื ืืืืข ืขื ืืขืืืช "ืืื ืฉืืืชืจ ืืืจ" ืืืืื ืืืชื ื ืื ืืกืืืื ืคืขืืืื ืืืืื ืคืฉืืืื ืืืืื ืื - pinba ื-xhprof.
ืคืื ืื ืฉืืื ืื ื ื ืชืื ืื ืกืืืืกืืืื ืืืืืืืช UDP ืขื ืืืืจืืช ืืคืขืืื ืฉื ืืืงืื ืืืคื ืืื ืืจื ื ื-PHP, ืืืืืื ื ืืจืืืช ืืืื ืืจื ื ืืืืกืื MySQL (ืคืื ืื ืืืืขื ืขื ืื ืืข MySQL ืืฉืื ืื ืืชืื ืืืจืืขืื ืืืืจ) ืจืฉืืื ืงืฆืจื ืฉื ืืขืืืช ืืืืืื ื ืืึนืชึธื. ื-xhprof ืืคืฉืจื ืื ื ืืืืืืืืช ืืืกืืฃ ืืจืคืื ืฉื ืืืฆืืข ืืคื PHP ืืื ืืืืืื ืืืงืืืืช ืืื ืชื ืื ืืืื ืืืืืื ืืื - ืืจืืืข, ืืืืื ืชื ืื ืืฉืื ืืืง ืืืชืจ.
ืืคื ื ืืื ืื, ืขืจืืช ืืืืื ืืชืืืฉื ืืื ืืข ืื ืคืฉืื ืืืืื ืืืืืกืก ืขื ืืืืืจืืชื ืืืื ืืงืก ืืืคืื, ืืืืฉื ืืฆืืจื ืืืฉืืืช ืืกืคืจืืืช Lucene ืืืืืืช - Elastic/Kibana. ืืจืขืืื ืืคืฉืื ืฉื ืืงืืืช ืืกืืืื ืืจืืื ืืืืื ืืืื ืืงืก ืืคืื ืฉื Lucene ืืืืืกืก ืขื ืืืจืืขืื ืืืืื ืื ืืืืคืืฉ ืืืืจ ืืื ืืืืฆืขืืช ืืืืงืช ืืืืืื ืืชืืจืจ ืืืืขืื ืืืื.
ืืืจืืช ืืืจืื ืืืื ื ืืืื ืฉื ืืืืืืช ื-Kibana ืขื ืืืฉืืื ืืจืื ื ืืืื ืืื "ืืื" "ืืืจื ืืืคื ืืขืื" ืืืฉืคื ืฉืืืืฆืื ืืืืฉ ืฉื ืืืืืืจื ืืืชืืืืกืืชืืช ืฉืืจื ื ืฉืืื ืืืืืืื, ืืืื ืืื ืืขืืืจ ืื ื ืืืื ืืืฉืืืืช ืืืืืช:
- ืืื ืฉืืืืืช PHP ืืื ืืืงืื Bitrix24 ืืคืืจืื p1 ืืฉืขื ืืืืจืื ื ืืืืื? ืืืืื, ืืกืืื ืืืชืงื ืืืืืจืืช.
- ืืื ืฉืืืืช ืืืืื ืืืฆืขื ืืคืืจืืืื ืืืจืื ืื ื-24 ืืฉืขืืช ืืงืืืืืช, ืืืืื ืืืืืช ืืืื ืงืฉืืื ืืขืจืืฅ/ืจืฉืช?
- ืขื ืืื ืคืืขืืช ืคืื ืงืฆืืื ืืืืช ืืืขืจืืช (ืชืืกืฃ C ืฉืื ื ืขืืืจ PHP), ืฉืืืจืืื ืืืืงืืจ ืืขืืืื ืืฉืืจืืช ืืืืจืื ืืืืฉืงื ืืืงืืืืช? ืืื ืืฉ ืชืงืืืช?
- ืืื ื ืชืื ื ืืงืืืืช ืืชืืืืื ืืืืืจืื PHP? ืืื ืืฉ ืฉืืืืืช ืืืื ืืจืืื ืืืืืืจืื ืฉืืืงืฆื ืืชืืืืืื: "ืืกืจ ืืืืจืื"? ืืืฆืื ืืื ืืจื.
ืื ื ืืืืื ืงืื ืงืจืืืช. ืืืจืืช ืืืืงื ืืกืืืืช ืืจื-ืฉืืืชืืช, ืืืงืื, ืขื ืืืจื ืืืื ืื ืกืื ืืจืื ืื ืชืื ื ืงืื ืคืืืืื, ืงืืื ืฉืืืื ืืขืฆืื ืช ืืืืชื ืฆืคืืื, ื ืฉืืขื ืกืืจื ื ืืืชืืื ืชืืืื ืืชืืงืื ืืืืืจ:
ืื ืืกืฃ, kibana ืืืคืฉืจืช ืืืจืื ืืืืขืืช ืืืืจืืขืื ืืืืืจืื, ืืชืื ืืื ืงืฆืจ ืืืื ืืืืจื ืืื ืืฉืืฉ ืขืฉืจืืช ืขืืืืื ืืืืืงืืช ืฉืื ืืช - ืืชืืืื ืืื ืืช ืืคืืชืื ืืขื QA.
ืืคืขืืืืช ืฉื ืื ืืืืงื ืืืืจื ืืคืื ื ืืื ืืืขืงื ืืืืืืื - ืืืงืื ืื ืชื ืืื ืืช ืืืื ืื ืืฉืจืชืื, ืืชื ืจืง ืฆืจืื ืืืืืืจ ืืืื ื ื ืืชืื ืคืขื ืืืช ืืืฉืืื ืืืชื ืืืฉืืื ืืืืกืื ืืื ืืืื ืืช, ืืืฉื, ืืืจืืืจืื ืืงืืื ื. ืืื ืืืืืื ืื ืืกืคืจ ืืืืจืื ืฉื ืืืจื ืืขืื ืฉื ื ืจืืฉืื ืฉืืืืคืกื ืืืืคืกืช ืชืืช ืืืื ืืืืืฉ ืืืจื ืืืืจืื.
ื ืืชืื ืขืกืงื ืืกืืกื
ืืืื ืืืืขืื ืฉื ืืชืื ืขืกืงื ืืืืจืืช ืืชืืื ืืจืื ืืฉืืืืฉ ืืงืืืื ืืืืชืจ ื-, ืื, ืืงืกื. ืืื ืืขืืงืจ ืฉืื ืื ื ืืืจ ืฉื. ืื ืืืื ืื ืืืืืงืก ืืืืกืก ืขื ื ืืืกืืฃ ืฉืื ืืืืืจื - ืืชื ืืชืืื ืืืจ ืืืชืจืื ืืืืจืื ืืืืืื.
ืืืืจื ืืืชืคืชืืช ืืฆืืจื ืืจืืื ืืช ืฉืื ื, ืืืื ืืืืคืืข ืคื ืืฉื "ื ืืืืื" ืฉื ืขืืืื ืืื ืื ืกืืืืช ืืืชืจ ืขื ื ืชืื ืื ืืืืืื ืืืชืจ. ืืฆืืจื ืืืืืืืื ืืขืืืงืื ืืจื ืืื ื ืืื ืืืืคืืข ืืืืคื ืงืืืข, ืืืืืฆืขืืช ืืืืฆืื ืฉื ืืืจ'ื ืืืืืงืืช ืฉืื ืืช, ืืคื ื ืืื ืื ืืืจืื ืคืชืจืื ืคืฉืื ืืคืจืงืื - ืฉืืืื ืฉื ClickHouse ื-PowerBI.
ืืืฉื ืื ืืจืื ืืื ืืคืชืจืื ืืืืืฉ ืืื ืขืืจ ืืืื, ืืื ืืื ืืื ืืชืืืื ืืืืืข ืืืื ื ืฉ-ClickHouse ืืื ืื ืืืื ืืื ืืคืฉืจ ืืืขืื ืืื.
ืืื ืืฉืื ืืืืื ืืืื ืฉ-ClickHouse, ืืื Druid, ืืื Vertica, ืืื Amazon RedShift (ืืืืืกืกืช ืขื postgres), ืื ืื ืืขืื ืื ืืืืืื ืืืืชืืืื ืื ืืชืื ื ืื ืืืื (ืกืืืืื, ืฆืืืจื, ืืื ืืืื-ืืงืกืืืื ืืคื ืขืืืืืช ืืืื ืืฆืืจืคืืช ืืคืฉืจืืืช ), ืื ืืืืจืื ืืืืกืื ืืขืื ืฉื ืขืืืืืช ืฉื ืืืืืืช ืืืกืื, ืื ืืืื ื-MySQL ืืืกืื ื ืชืื ืื ืืืจืื (ืืืืืื ื ืฉืืจืืช) ืืืืืจืื ืื ื.
ืืขืฆื, ClickHouse ืืื ืจืง "ืืกืืก ื ืชืื ืื" ืจืื ืืืชืจ, ืขื ืืื ืกื ืื ื ืืื ืืืืืื ื ืงืืืชืืช (ืืื ืื ื ืืขื, ืืื ืืกืืจ), ืืื ื ืืชืื ื ืขืื ืืืขืจืืช ืฉื ืคืื ืงืฆืืืช ืืืงืืช ืืขื ืืื ืืช ืืขืืืื ืขื ื ืชืื ืื. ืื, ืืชื ืืืื ืืคืืื ืืืฆืืจ ืืงืืฅ - ืืื ืืชื ืืืื ืฉืืงืืขื ืืืกืืจืื ืขื ืืืงืจืืกืงืืค ืื ืื ืืืืจื ื ืืื ืืืชืืื ื ืืืคืฉ ืคืชืจืื ืืช ืืืจืื.
ืืืงืืฉ ืืคืืชืื ืืื ืืืกืืื
ืืืืจื ืฉืื ื ืืฉ ืืคืชืืื ืจืืื ืฉืืืชืืื ืงืื ืืืขื ืื ืืื ืืืฉื 10-20 ืฉื ื ื-PHP, JavaScript, C#, C/C++, Java, Go, Rust, Python, Bash. ืืฉื ื ืื ืื ืืื ืืขืจืืช ืื ืืกืื ืจืืื ืฉืืื ืืืชืจ ืืืกืื ืืื ืืืืื ืืืืืืื ืฉืืื ื ืืชืืื ืืืืงื ืืกืืืืกืืืงื (ืืืืืื, ืืืฉืจ ืจืื ืืืืกืงืื ื-raid-10 ื ืืจืกืื ืขื ืืื ืืืช ืืจืง ืืืงื). ืื ืกืืืืช ืืืื, ืืืฉื ืืื ืจื ืื ืืื ืืจืืจ ืื ืื "ืื ืืืืืงืื ืคืืชืื". Python ืืื ืืื PHP, ืจืง ืืฉื ืงืฆืช ืืืชืจ ืืจืื ืืืฉ ืงืฆืช ืคืืืช ืขืงืืืช ืฉื ืืืืจืื ืืฉื ืื ืชืืืขื ืืงืื ืืืงืืจ ืฉื ืืืชืืจืืื. ืขื ืืืช, ืืื ืฉื ืืฆืจื ืืืชืจ ืืืืชืจ ืืืืืช ืื ืืืืืื, ืืคืชืืื ืื ืืกืื ืืืื ืืืืื ืืืชืจ ืืืืชืจ ืืช ืืืฉืืืืช ืฉื ืืชืืืืช ืฆืจื ืืืืื ืืื numpy, pandas, matplotlib, seaborn.
ืืช ืืชืคืงืื ืืืืจืืข, ืืื ืื ืจืื, ืืืืื ืืชืขืืคืืช ืคืชืืืืืช ืฉื ืขืืืืื ืืฉืืืื ืืืืืื "ืจืืจืกืื ืืืืืกืืืช" ืืืคืื ืช ืืืืื ืืขืื ืขื ื ืชืื ืื ืืืืืื ืืืืฆืขืืช, ืื, ืื, pyspark.
Apache Spark, ืืคืจืืืืื ืืคืื ืงืฆืืื ืืืช ืฉืื ืืชืืืื ืืืืืจื ืจืืฆืืื ืืช ืืฆืืจื ืืืฉืืืช, ืืืืืืืืช ืฉืื ืขืฉื ืจืืฉื ืขื ืืคืชืืื ืืืืจืืืื ื-MySQL ืฉืืฆืืจื ืืืืง ืืช ืืฉืืจืืช ืขื ืื ืืืกืืื ืื ืืกืื ืืชืืจืจ ืืฉืืฉ.
ื ืืกืืื ืืช ื ืืกืคืื ืฉื Apache Spark/Hadoop ืืืืจืื ืืื ืื ืืืฉ ืืื ืืคื ืืชืกืจืื
ืขื ืืืช, ืืืจ ืืืื ืืชืืจืจ ืฉืืฉืื ืืขืจืืชืืช ืื ืืืฉ ืชืงืื ืขื Spark, ืื ืฉืคืฉืื ืืื ืฆืืจื ืืฉืืืฃ ืืช ืืืืืื ืืื ืืืชืจ. ืื ืขืจืืืช Hadoop/MapReduce/Lucene ื ืืฆืจื ืขื ืืื ืืชืื ืชืื ืื ืืกืื ืืืื, ืืื ืืจืืจ ืื ืืกืชืืืื ืืงืจืื ืขื ืงืื ืืืงืืจ ื-Java ืื ืืจืขืืื ืืช ืฉื Doug Cutting ื- Lucene, ืื Spark, ืคืชืืื, ื ืืชื ืืฉืคื ืืืงืืืืืช Scala, ืฉืืื ืืืื ืฉื ืื ืืืืืืงืช ืื ืงืืืช ืืื ืฉื ืคืจืงืืืืช ืืืจืืข ืืื ื ืืชืคืชื. ืืืืจืืื ืืงืืืขื ืืืืฉืืืื ืืืฉืืื Spark ืขืงื ืขืืืื ืื ืืืืื ืืช ืืื ืืืื ืฉืงืืคื ืขื ืืงืฆืืช ืืืืจืื ืืฆืืฆืื ืคืขืืืืช (ืืคืชืืืช ืจืืื ืืืืขืื ืืืช ืืืช) ืืฆืจื ืกืืืื ืืืื ืฉื ืืฉืื ืฉืืฉ ืื ืืงืื ืืืืื. ืื ืืกืฃ, ืืืฆื ืืืืืจ ืขื ืืื ืืกืคืจ ืจื ืฉื ืืฆืืืืช ืคืชืืืืช ืืืืจืืช, ืงืืฆืื ืืื ืืื ืฉืืืื ืืืงืืืืช ืืื ืื ืืืื ืื ืืชืืืช ืืืืื ืื ืฉื ืฆื ืฆื ืช - ืื ืฉืืจื ืืื ืืื ืืขืจืืช ืืชืืืฉื ืืืช ืฉืืืืชื ืืืืจืช ืืืื ืืืืืืช: ืฉื ืื ืขืื (ืื ืืืื ืื ืืื ืฆืจืืืื ืืฉืืืฃ ืืืืื ืขื ืกืืื).
ืืชืืฆืื ืืื, "ืฉืจืื ื" ืืกืคืจ ืคืจืืืงืืื ืื ืืืืืื ืคื ืืืืื ืืืฉืชืืฉืื ืืืืคื ืคืขืื ื- Apache Spark (ืืืื Spark Streaming, Spark SQL) ืืืืขืจืืช ืืืงืืืืืืช ืฉื Hadoop (ืืื ืืืื ืืื ืืืื). ืืืจืืช ืืขืืืื ืฉืขื ืืืื ืืืื ื ืืืชืืื ื ืืื ืืจ ืืช "ืื" ืื ืืื, ื"ืื" ืืืขื ืืคืกืืง ืืงืจืืก ืคืชืืื ืืืื ืฉืื ืืืื ืืืืคื ืื ืชืื ืื ืืืืกืจ ืืืืืื ืฉื ืืืืื RDD ืืืื, ืืจืฆืื ืืงืืช ืืฉืื ืืืจ ืืืื , ืขืืืื ืืื ืืื ืืืคืฉืื ืืขื ื ืืชืืืง ืืืชืจ ืืืืชืจ. ืืชืงืืคื ืื ื ืืกืื ื ืืืฉืชืืฉ ืืืืืื ืืขื ื ืืืืื ืฉื ืฉืืจืืชื ืืืื ืืจื ื ืฉื ืืืืื -
ืืืกืื ืงืืฆื ืืืื ืื ืืชืื ืืื ืฆืืจื ืืืืฃ
ืืืืืื ืฉื "ืืืฉืื" Hadoop/Spark ืขื ืืืืืืช ืืืืงืื ืฉืื ืื ืืืืฃ ืื ืืืืชื ืืฉืืื. ืืฆืืจื ืืืฆืืจ ืืืกืื ืงืืฆืื ืืืื, ืืื ืืืืื ืฉืืืื ืขืืื ืืคื ื ืชืงืืืช ืืืืจื ืืื ื ืืชื ืืืื ืืืืกื ืงืืฆืื ืืคืืจืืืื ืฉืื ืื ืืืขืจืืืช ืฉืื ืืช ืืืขืฉืืช ืืืืืืช ืืขืืืืช ืืืกืืื ืืืช ืืืื ืืืืืืืื ืื ืชืื ืื ืืื. ืืจืืจ.
ืจืฆืืชื ืื ืฉืขืืืื ืืชืืื ื ืฉื ืืคืืืคืืจืื ืืื ืื ืืืคืื ืืกืืื ืฉื ืืฉื ื ืืืืฉื ืขื ืงืจืืืช ืขืงืืืช Java ืฉื 20 ืขืืืืื ืื ืืชืื ืืืื ืื ืืคืืจืืื ืืืืจื ืงืืืืืืจืื ืฉื ืืืฉืืื ืืืืฆืขืืช Spark History Server ืืืืืืืช ืืืืืช ืขื ืชืืืจื ืืืืจืืช. ืจืฆืืชื ืฉืืืื ืื ืืื ืคืฉืื ืืฉืงืืฃ ืฉืื ืืฆืจืื ืฆืืืื ืงืืืขื ืืชืืช ืืืืกื ืืื ืืข ืื ืืงืฉืช ื- MapReduce ืืกืื ืืจืืืช ืฉื ืืืคืชื ืชืคืกืืง ืืคืขืื ืืืฉืจ ืขืืื ื-reduce data ื ืคื ืืืืืืจืื ืืืื ืืืืืจืืชื ืืืืงืช ื ืชืื ื ืืงืืจ ืฉืื ื ืืืจ ืืืื.
ืืื ืืืืื S3 ืืืขืืืช ื-DataLake?
ืื ืืกืืื ืขื Hadoop/MapReduce ืืืื ืืืชื ื ืฉืื ื ืืงืืงืื ืืืขืจืืช ืงืืฆืื ื ืืชื ืช ืืืจืืื ืืืืื ื ืืืขืืื ืขืืืืื ื ืืชื ืื ืืืจืืื, ืฉ"ืืชืงืจืืื" ืื ืชืื ืื ืืื ืื ืืื ืืข ืืช ืื ืชืื ืื ืืจืฉืช. ืขืืืืื ืฆืจืืืื ืืืืืช ืืกืืืืื ืืงืจืื ื ืชืื ืื ืืคืืจืืืื ืฉืื ืื, ืื ืจืฆืื ืื ืืงืจืื ืืืืข ืืืืชืจ ืืืืืืช ืืกืืืืื ืืืืกื ื ืชืื ืื ืืจืืฉ ืืคืืจืืืื ื ืืืื ืืขืืืืื.
ืฉืื, ืืจืขืืื ืืืกืืกื. ืืื ืฉืื ืจืฆืื "ืืฉืคืื" ืืื ืืืื ืืชืื ืื ืืข ืื ืืืื ืืงืืฅ ืืื, ืฉืืืื ืง ืืืืงืื ืื ืืืืืืจ ืืชืฆืืจื ืืืืืจ ืืืชื ืืฆืืจื ืืืืขืจืช. ืื ื ืจืืฆื ืืืืกื ืงืืฆืื, ืจืง ืงืืฆืื, ืืคืืจืื ืืืื ืืืืฆืข ืขืืืื ืฉืืืืชืืช ืื ืืืืืืช ืืขืืืืช ืืืืฆืขืืช ืืืื ืฉืื ืื ืื ืืืื ืื. ืืืืื ืขืื ืืขืื ืงืืฆืื ืืคืืจืืืื ืฉืื ืื. ืืขืืืฃ ืืืจืืก ืื ืืช ืืื ืืข, ืืื ืืช ื ืชืื ื ืืืงืืจ. ืื ืื ื ืฆืจืืืื DataLake ื ืืชื ืืืจืืื ืืืื ืืืจืกืื, ืืืืื ื...
ืื ืื ืชืืืกื ื ืงืืฆืื ืืืืกืื ืืขื ื ืื ืืชื ืืืจืืื ืืืืืจ ืืืืืืข Amazon S3, ืืืื ืฉืชืฆืืจืื ืืืืื ืฆืืขืืช ืืฉืืื ื-Hadoop?
ืืจืืจ ืฉืื ืชืื ืื ืืืืฉืืื "ื ืืืืื", ืืื ืื ืืืื ื ืชืื ืื ืืืจืื ืื ืื ืื ื ืืืฆืืืื ืืืชื ืืฉื ื"ืื ืืขืื ืืืชื ืืืขืืืืช"?
ืืขืจืืช ืืงืืืืืืช ืฉื Cluster-bigdata-analytics ืฉื Amazon Web Services - ืืืืืื ืคืฉืืืืช ืืืื
ืื ืืฉืคืื ืขื ืคื ืื ืืกืืื ืฉืื ื ืขื AWS, Apache Hadoop/MapReduce ื ืืฆื ืืฉืืืืฉ ืคืขืื ืฉื ืืืจ ืืื ืจื ืชืืช ืจืืืื ืฉืื ืื, ืืืฉื ืืฉืืจืืช DataPipeline (ืื ื ืืงื ื ืืขืืืชืื, ืื ืืืื ืืืืื ืืืชื ื ืืื). ืืื ืืืืจื ื ืืืืืืื ืืฉืืจืืชืื ืฉืื ืื ืืืืืืืช DynamoDB:
ืืื ืคืืขืืื ืืืืคื ืงืืืข ืขื ืืฉืืืืืช Hadoop/MapReduce ืืฉืืืฆืื ืืื ืฉืขืื ืืืจ ืืื ืฉื ืื. "ืงืืข ืืช ืื ืืฉืื ืืื":
ืืชื ืืืื ืื ืืขืกืืง ืืืขืืืืช ืืฉืื ืืื ื ืชืื ืื ืขื ืืื ืืืืจืช ืืืฉืืื ื ืืืืื ืฉื Jupiter ืืขื ื ืขืืืจ ืื ืืืกืืื ืืฉืืืืฉ ืืฉืืจืืช AWS SageMaker ืืื ืืืื ืืืคืจืืก ืืืืืื ืฉื AI ืืงืจื. ืื ืื ื ืจืื ืืฆืื ื:
ืืื, ืืชื ืืืื ืืืจืื ืืืฉื ื ืืื ืืขืฆืื ืื ืืื ืืืกื ืืขื ื ืืืฆืจืฃ ืืืชื ืืืฉืืื Hadoop/Spark, ืืขืฉืืช ืืช ืืืืฉืืืื ืืื ืืืกืืจ ืืื:
ืืืฉ ื ืื ืืคืจืืืงืืื ืื ืืืืืื ืืืืืื ืืืืืงื ืืฉืชืืฉื ื ืืืฆืืื ืืฉืืจืืช EMR ืืืืฉืืืื ืื ืืชืืืื ืืงื ื ืืืื ืืืื. ืื ืืืื ืคืชืจืื ืืขืจืืช ืขืืืจ DataLake, ืืื ืื ืืขืืื? ืืจืืข ืื ืืืื ื ืขื ืกืฃ ืชืงืืื ืืืืืืฉ ืืืืฉืื ื ืืืืคืืฉืื.
ืืืง AWS - ืืจืื ืืงืคืืื ืืคืืฆ'ื ืกืคืืจืง ืขื ืกืืจืืืืืื
ืืชืืจืจ ืฉื-AWS ืืฉ ืืจืกื ืืฉืื ืฉื ืขืจืืืช "ืืืืจืช/ืืืืจ/ื ืืฆืืฅ". ืชืคืงืืื ืฉื ืืืืจืช, ืืืืืจ. ืงืืืื ืืงืืฆืื ืืกืืืืื ื-DataLake ืืืืฆืข ืขื ืืื ืฉืืจืืช "ืงืืืื ื ืชืื ืื", ืฉืืื ื ืืกืชืืจ ืืช ืชืืืืืชื ืืคืืจืื Apache Hive. ืขืืื ืืืืกืืฃ ืืืืข ืืฉืืจืืช ืื ืืืื ืืืื ืืืืงืืื ืืงืืฆืื ืฉืื ืืืืืื ืคืืจืื ืื ื ืืฆืืื. ืื ืชืื ืื ืืืืืื ืืืืืช ืื ืจืง ื-s3, ืืื ืื ืืืกื ืื ืชืื ืื, ืืื ืื ืื ืื ืืฉื ืฉื ืืคืืกื ืืื. ืื ืืืืจืื ืช ืกืคืจืืืช ืื ืชืื ืื ืฉื DataLake ืฉืื ื:
ืืงืืฆืื ืจืฉืืืื, ืืขืืื. ืื ืืงืืฆืื ืขืืืื ื, ืื ื ืืฉืืงืื ืกืืจืงืื ืืืืคื ืืื ื ืื ืขื ืคื ืืื ืืื ืื, ืฉืืขืืื ื ืืืืข ืขืืืื ืืืืื ืืืฉืืจื ืืืชื. ืืืืจ ืืื ื ืืชื ืืขืื ืืช ืื ืชืื ืื ืืืืื ืืืืขืืืช ืืช ืืชืืฆืืืช ืืืงืื ืืืฉืื. ืืืงืจื ืืคืฉืื ืืืืชืจ, ืื ื ืืขืืื ืื ื-s3. ืขืืืื ื ืชืื ืื ืืืื ืืืืขืฉืืช ืืื ืืงืื, ืื ืืืืืฅ ืืืืืืจ ืืช ืืขืืืื ืืืฉืืื Apache Spark ืืืืฆืขืืช ืืืืืืช ืืชืงืืืืช ืืจื AWS Glue API. ืืืขืฉื, ืืชื ืืืื ืืงืืช ืืช ืงืื ืืคืืชืื ืืืฉื ืืืืื ืืืืืืจ ืืืืฆืขืืช ืกืคืจืืืช pyspark ืืืืืืืจ ืืช ืืืืฆืืข ืฉืื ืขื N ืฆืืชืื ืฉื ืืฉืืื ืืขื ืงืืืืืช ืืืฉืื ืขื ื ืืืืจ, ืืืื ืืืคืืจ ืืืขืืื ืฉื Hadoop ืืืืจืืจ ืงืื ืืืื ืจืื ืฉื docker-smoker ืืืืื ืืชื ืืฉืืืืช ืชืืืช .
ืฉืื, ืจืขืืื ืคืฉืื. ืืื ืฆืืจื ืืืืืืจ ืืช Apache Spark, ืืชื ืจืง ืฆืจืื ืืืชืื ืงืื python ืขืืืจ pyspark, ืืืืืง ืืืชื ืืืืคื ืืงืืื ืขื ืฉืืืื ืืขืืืื ืฉืื ืืื ืืืคืขืื ืืืชื ืขื ืืฉืืื ืืืื ืืขื ื, ืชืื ืฆืืื ืืืื ื ืืฆืืื ื ืชืื ื ืืืงืืจ ืืืืื ืืฉืื ืืช ืืชืืฆืื. ืืคืขืืื ืื ืืืจืื ืืฉืืืืฉื, ืืื ื ืืื ืืืืืจืื ืืช ืื:
ืืคืืื, ืื ืืชื ืฆืจืื ืืืฉื ืืฉืื ืขื ืืฉืืื Spark ืืืืฆืขืืช ื ืชืื ืื ื-s3, ืื ื ืืืชืืื ืงืื ื-python/pyspark, ืืืืงืื ืืืชื, ืืืืฆืืื ืืขื ื.
ืื ืขื ืืชืืืืจ? ืื ืื ืืืฉืืื ืชืืคืื ืืชืืขืื? ืื, ืืืฆืข ืืขืฉืืช ืฆืื ืืจ ืืคื ืืกืื ืื Apache Pig ืืืคืืื ื ืืกืื ื ืืืชื, ืืื ืืื ืชืืื ืืืืื ื ืืืฉืชืืฉ ืืชืืืืจ ืืืืชืื ืืืฉืืช ืฉืื ื ื-PHP ื-JavaScript (ืื ื ืืืื, ืืฉ ืืืกืื ื ืก ืงืืื ืืืืื, ืืื ืื ืขืืื, ืขืืืจ ืฉื ืื ืืืื ืฉืืืืืช).
ืืคืืจืื ืฉื ืืงืืฆืื ืืืืืืกื ืื ืืืื ืืื ืืืคืชื ืืืืฆืืขืื
ืื ืืืื ืืืื ืืฉืื ืืืืื ืขืื ืฉืชื ื ืงืืืืช ืืคืชื. ืขื ืื ืช ืฉืฉืืืืชืืช ืขื ื ืชืื ื ืงืืฆืื ืืืื ืืชืืฆืขื ืืืืืจืืช ืืืคืฉืจืืช ืืืืืฆืืขืื ืื ืืืจืืจื ืืืฉืจ ืืืืข ืืืฉ ื ืืกืฃ, ืขืืื:
- ืืืกื ืขืืืืืช ืฉื ืงืืฆืื ืื ืคืจื (ืืื ืฉืื ืชืฆืืจื ืืงืจืื ืืช ืื ืืฉืืจืืช ืืื ืืืืื ืื ืืฉ ืืขืืืืืช). ืืฉืืื ืื ืืงืื ื ืืช ืคืืจืื ืืคืจืงื ืขื ืืืืกื
- ืืฉืื ืืืื ืืืืืจ ืงืืฆืื ืืชืืงืืืช ืืื: ืฉืคื, ืฉื ื, ืืืืฉ, ืืื, ืฉืืืข. ืื ืืขืื ืฉืืืื ืื ืืกืื ืื ืฉื ืจืืกืืง ืืกืชืืื ืจืง ืขื ืืชืืงืืืช ืืืจืืฉืืช, ืืืื ืื ืคืืช ืืช ืื ืื ืชืื ืื ืืจืฆืฃ.
ืืขืืงืจื ืฉื ืืืจ, ืืืจื ืื, ืืชื ืคืืจืก ืืช ื ืชืื ื ืืืงืืจ ืืฆืืจื ืืืขืืื ืืืืชืจ ืขืืืจ ืืื ืืขืื ืืื ืืืืืื ืืชืืืืื ืืืขืื, ืฉืืคืืื ืืชืืงืืืช ืืจืืกืงืืช ืืืืืื ืืืืื ืก ืืืงืจืื ืจืง ืืช ืืขืืืืืช ืื ืืืฆืืช ืืงืืฆืื ืืืืคื ืกืืงืืืื. ืืชื ืื ืฆืจืื "ืืืื" ืืช ืื ืชืื ืื ืืฉืื ืืงืื (ืืืืกืื ืคืฉืื ืืชืคืืฆืฅ) - ืคืฉืื ืืื ืก ืืืชื ืืื ืืืืืื ืืืขืจืืช ืืงืืฆืื ืืคืืจืื ืื ืืื. ืืืืื, ืืื ืฆืจืื ืืืืืช ืืจืืจ ืฉืืืกืื ืงืืืฅ csv ืขื ืง ื-DataLake, ืฉืงืืื ืื ืฆืจืื ืืงืจืื ืืืชื ืฉืืจื ืืืจ ืฉืืจื ืขื ืืื ืืืฉืืื ืืื ืืืืฅ ืืช ืืขืืืืืช, ืื ืืืื ืจืฆืื. ืชืืฉืื ืฉืื ืขื ืฉืชื ืื ืงืืืืช ืืขืื ืื ืขืืืื ืื ืืจืืจ ืืื ืื ืื ืงืืจื.
AWS Athena - ืื'ืง-in-the-box
ืืื, ืชืื ืืื ืืฆืืจืช ืืื, ืืืืฉืื ื ืชืงืื ื ืืืขืืช ืืืืืื ืก ืืชื ื. ืคืชืืื ืืชืืจืจ ืฉืืืืฆืขืืช ืกืืืืจ ืงืคืื ื ืฉื ืงืืฆื ืืืืื ืืขื ืงืืื ืฉืื ื ืืจืกืืกื ืชืืงืืืช ืืคืืจืื ืืขืืืืืช ืื ืืื (ืคืจืงื), ืืชื ืืืื ืืืจ ืืืื ืืืฆืข ืืื ืืืืจืืช ืืื ืคืืจืืืืืืืช ืืืืชืจ ืืืื ืืช ืืืืืช ืืื, ืืื ืืฉืืื Apache Spark/Glue.
ืื ืืข Athena ืืืืคืขื ืขื ืืื ื ืชืื ืื ื-s3 ืืืืกืก ืขื ืืืืื
ืื ืืชืืืืจ ืืืงืฉืืช ืืืชื ื ืืขื ืืื. ืื ืื ื ืืฉืืืื ืขืืืจ
ืืืืงืฉืช ืจืง ืืช ืืขืืืืืช ืื ืืืฆืืช ืืชืืงืืืช ืฉื ืฉืืจื ืืืืื, ืืชืืจืจ ืฉืฉืืจืืช ืืชื ื ืขืืื ืื ื ืขืฉืจืืช ืืืืจืื ืืืืืฉ. ืืืื, ื ืืืจ, ืืืขื ืืืื ื, ืืืฉืืืื ืื ืืชืื ืขื ืืฉืืืืืช!
ืืื, ืื ืื ื ืืืืงืื ืืช ืื ืชืื ืื ืฉืื ื ื-s3:
ืืชืืฆืื ืืื, ืชืื ืืื ืงืฆืจ ืืืื ืืืืงืืช ืฉืื ืืช ืืืืืืื ืืืืจื, ืืืืืืช ืืืืข ืืืื ืืื ืืืืืงื, ืืฉืืื ืืงืฉืืช ืืืชื ื ืืืืคื ืืงืืืื ืืืืจ, ืชืื ืฉื ืืืช, ืืงืื ืชืฉืืืืช ืืืขืืืืช ืื ืชืื ืื "ืืืืืื" ืขื ืคื ื ืชืงืืคืืช ืืจืืืืช ืืืื: ืืืืฉืื, ืืฆื ืฉื ื ืืื' ืค.
ืืื ืืืื ื ืจืืืง ืืืชืจ ืืืชืืื ื ืืืืช ืืขื ื ืืื ืืงืื ืชืฉืืืืช
ืืชืืฆืื ืืื, ืืืืจ ืฉืืืืื ื ืืืืกื ื ืชืื ืื ื-s3, ืืคืืจืื ืืืจ ืืขืื ืืขื ืคืืฆืื ืกืืืจ ืฉื ื ืชืื ืื ืืชืืงืืืช... ืงืืืื ื ืืช DataLake ืืื ืืข ืื ืืืื ืืืืจ ืืืื - ืืืื ื. ืืืื ืืคื ืคืืคืืืจื ืืืื ืืืืจื, ืื... ืืืื SQL ืืขืืื ืืกืืจื ืืืื ืืืจ ืืืชืจ ืืืฉืจ ืืจื ืืคืขืื/ืขืฆืืจื/ืืืืจืช ืืฉืืืืืช. "ืืื ืืชืืฆืื ืืื, ืืื ืืฉืื ืืืชืจ?"
ืืงืฉื ืืืชื ื ื ืจืืืช ืืขืจื ืื. ืื ืชืจืฆื, ืืืืื, ืืชื ืืืื ืืืฆืืจ ืืกืคืืง
ืืืฆืืื
ืืืืจ ืฉืขืืจื ื, ืฉืื ืืืืจ, ืืจื ืืจืืื, ืืื ืืืืืช, ืชืื ืืขืจืืช ืื ืืืื ืืจืืื ืืช ืืกืืืื ืื ืืืช ืจืืช ืืืืจืืืืช ืืืขืืืช ืฉื ืืชืืืื, ืืฆืื ื ืคืชืจืื ืขืืืจ DataLake ืืื ืืืืืงืก ืฉืื ืืคืกืืง ืืจืฆืืช ืืืชื ื ืื ืืืืืจืืช ืืื ืืขืืืช ืืืขืืืช.
ืืชืืจืจ ืฉืื ืืืช DataLake ืืขืื, ืืืืจ ืืืื ืืชืคืขืื ืืฆืจืืื ืฉื ืืืืงืืช ืฉืื ืืช ืืืืืืื ืืืืจื ืืื ืืืืจื ืืืกืืจืช ืืืืืืืช ืฉื ืื ืืคืชืืื ืื ืืกืื ืฉืืขืืื ืื ืขืืื ืืืืจืืืืื ืืื ืืืืขืื ืืฉืจืื ืจืืืืขืื ืขื ืจืืืืขืื ืขื ืืืฆืื ืืืืืจืื 50 ืืื ืืื ืืืืงืืกืืกืื ืฉื Hadoop.
ืืชืืืืช ืืืจื ืจืืฉื ืืชืคืฆื ืืื ื ืืืืืช ืืคืจืืืื ืืจืืื ืฉื ืชืืื ืืช ืคืชืืืืช ืืกืืืจืืช ืืืืื ืช ื ืื ืืืืจืืืช ืขื ืืฆืืฆืืื. ืคืฉืื ืืชืื ืืื ืืช ืืช ื-DataLake ืฉืื โโืืืืื ืคืฉืืืื: nagios/munin -> elastic/kibana -> Hadoop/Spark/s3..., ืืืกืืฃ ืืฉืื ืืืื ื ืขืืืงื ืฉื ืืคืืืืงื ืฉื ืืชืืืืืื ืืืชืจืืฉืื. ืื ืืืจ ืืืจืื ืืขืืืจ - ืชื ื ืืืชื ืืืืืืื ืืืืชืืจืื.
ืื ืืชื ืื ืจืืฆื ืืืืช ืืขื ื ืืืืื ืืชืืื, ืืขืืื ืืืชืงื ืคืจืืืงืืื ืฉื ืงืื ืคืชืื, ืืชื ืืืื ืืื ืืช ืกืืืื ืืืื ืืฉืื ื ืืืืคื ืืงืืื, ืขื ืืืื ืืช ืืฉืจืืืืช ืืืืืช ืขื Hadoop ื-Presto ืืืขืื. ืืขืืงืจ ืื ืืขืฆืืจ ืืืืชืงืื, ืืกืคืืจ, ืืืคืฉ ืคืชืจืื ืืช ืคืฉืืืื ืืืจืืจืื ืืืื ืืืืื ืืกืชืืจ! ืืืฆืืื ืืืืื ืืืืชืจืืืช ืฉืื!
ืืงืืจ: www.habr.com