ืขื ืคื
ื ืืชืืชื ืืฉืจืืช ืคื ืืืืช ืืชืคืงืื ืืื ืืก ื ืชืื ืื ืืคื ืฉืื ืืื ืืืจ 2020 ืืื ืืืืื ืืืื ืืืืื ืืืืช ืืื ืืืืืืืช ืืคืืคืืืจืืืช ืืืืชืจ. ืืืจ ืื ืืฉืืืืชื ืืช ืืชืืฆืืืช ืขื ื ืชืื ืื ืกืืืืกืืืื ืขื ืืฉืจืืช ืคื ืืืืช ืืชืคืงืื ืืืขื ื ืชืื ืื - ืืืืคืืขื ืืื ืืืืืื ืืขื ืืื ืื.
ืืื ืืจืื ืืงืืื, ืืืื ืขืฉืจ ืืืื ืืืืืืืช ืืืืืืืืช ืืืืืืจืืช ืืจืื ืืคืจืกืืื ืืจืืฉืื:
ืืืืืจ ืืื ืืืืืืืช ืืืฉืจืืช ืคื ืืืืช ืืชืคืงืื ืืื ืืก ื ืชืื ืื ืืฉื ืช 2020
ืืื ื ืขืฉื ืืช ืื ื ืืื.
ืืืจืืืช ืืื ืืก ื ืชืื ืื
ืืืื ืืฉ ืืฉืืืืช ืจืื ืืขืืืื ืฉืืื ืืกื ื ืชืื ืื ืขืืฉืื ืขืืืจ ืืจืืื ืื โ ืืื ืื ืืื ืฉืื ืฉืืืจืืื ืขื ืืืกืื ืืืืืข ืืืืืชื ืืฆืืจื ืืื ืฉืขืืืืื ืืืจืื ืืืืื ืืขืืื ืืืชื. ืืื ืืกื ื ืชืื ืื ืืื ืื ืฆืื ืืจืืช ืืืืจืืช ืื ืืฆืืื ืฉื ื ืชืื ืื ืืืงืืจืืช ืืจืืืื. ืืืืจ ืืื, ืฆืื ืืจืืช ืืืฆืขืื ืคืขืืืืช ืืืืืฅ, ืืจื ืกืคืืจืืฆืื ืืืขืื ื (ืืืืืื ืืืจืืช, ืชืืืืื ETL), ืื ืฉืืืคื ืืช ืื ืชืื ืื ืืืชืืื ืืืชืจ ืืฉืืืืฉ ื ืืกืฃ. ืืืืจ ืืื, ืื ืชืื ืื ืืืขืืจืื ืืื ืืืกืืื ืืืืขื ื ื ืชืื ืื ืืขืืืื ืืขืืืง ืืืชืจ. ืืืกืืฃ, ืื ืชืื ืื ืืกืืืืื ืืช ืืจืื ืืืจืืื ืืืืื ืื, ืืืืืช ืืืืืืื ืฉื ืืืืืช ืืืื ื.
ืืืคืฉืชื ืืืืข ืฉืืืคืฉืจ ืื ืืืกืืง ืืื ืืืื ืืืืืืืช ืืืืืงืฉืืช ืืืืชืจ ืืขืืืืชื ืฉื ืืื ืืก ื ืชืื ืื ืืจืืข.
ืฉืืืืช
ืืกืคืชื ืืืืข ืืฉืืืฉื ืืชืจื ืืืคืืฉ ืขืืืื -
ืขืืืจ ืื ืืืืช ืืคืชื ืืืฉืืชื ืืช ืืืื ืืื ืืกืืช ืืืกืคืจ ืืืงืกืืื ืืืืื ืืื ืืชืจ ืื ืคืจื, ืืืืืจ ืืื ืืืฉืืชื ืืช ืืืืืฆืข ืขืืืจ ืฉืืืฉืช ืืืงืืจืืช.
ืืืฆืืื
ืืืื ืฉืืืฉืื ืืืื ืืื ืฉื ืื ืืกืช ื ืชืื ืื ืืื ืืื ืขื ืืฆืืื ืื ืืืืืืื ืืืืชืจ ืืื ืฉืืืฉืช ืืชืจื ืืขืืืื.
ืืื ื ืืืชื ืืกืคืจืื, ืื ืืืฆืืื ืืฆืืจืช ืืืื:
ืืื ื ืื ืืคื ืืกืืจ.
ืกืงืืจืช ืชืืฆืืืช
ืื SQL ืืื Python ืืืคืืขืื ืืืืชืจ ืืฉื ื ืฉืืืฉืื ืืืืฉืจืืช ืื ืืืงืืช. ืฉืชื ืืืื ืืืืืืืช ืืืื ืื ืฉืืืืื ืืืช ืืืืื ืชืืืื.
ืกืคืืจืง ืืืืืจ ืืืืืฆืืช ืืืืฉืจืืช ืืคื ืืืืช.
AWS ืืืคืืข ืื-45% ืืืฉืจืืช ืืจืืฉืื. ืืืื ืคืืืคืืจืืช ืืืฉืื ืขื ื ืืืืืฆืจืช ืขื ืืื ืืืืื; ืืฉ ืื ืืช ื ืชื ืืฉืืง ืืืืื ืืืืชืจ ืืืื ืื ืคืืืคืืจืืืช ืืขื ื.
ืืืืฉื ืืืืขืื Java ื-Hadoop - ืงืฆืช ืืืชืจ ื-40% ืืืืืื.
ืื ืืื ืืจืืื ืืืืื ืช ืืื
ืืืืจ ืืื ืื ื ืจืืืื ืืช Hive, Scala, Kafka ื-NoSQL - ืื ืืืช ืืืืื ืืืืืืืช ืืืื ืืืืืจืช ืืจืืข ืืืืฉืจืืช ืืคื ืืืืช ืฉืืืืฉื. Apache Hive ืืื ืชืืื ืช ืืืกื ื ืชืื ืื ืฉ"ืืงืื ืขื ืงืจืืื, ืืชืืื ืื ืืืื ืฉื ืืขืจืื ื ืชืื ืื ืืืืืื ืืฉืืื ืื ืืื ืืืืช ืืืืืจืืช ืืืืฆืขืืช SQL."
ืืฉืืืื ืืืื ืืื ืืืฉืจืืช ืคื ืืืืช ืฉื ืืืขื ื ื ืชืื ืื
ืืืื ืฉืืืฉืื ืืื ืืื ืืื ืืืืืืื ืื ืคืืฆืื ืืืืชืจ ืืงืจื ืืขืกืืงืื ืืชืืื ืืืขื ืื ืชืื ืื. ืืฉืืชื ืจืฉืืื ืื ืืืืชื ืืืคื ืืคื ืฉืชืืืจ ืืขืื ืขืืืจ ืื ืืกืช ื ืชืื ืื.
ืืืืืจืื ืฉื ืืื ืืืืืื ืืืฉืจืืช ืคื ืืืืช ืืชืคืงืื ืืืขื ื ืชืื ืื ื-2020
ืื ืืืืจืื ืขื ืืืกืคืจ ืืืืื, ืืืฉืืืื ืืืืืก ืฉื ืืฉื ืืขืืจ, ืืื 28% ืืืชืจ ืืฉืจืืช ืคื ืืืืช (12 ืืขืืืช 013). ืืืื ื ืจืื ืืืื ืืื ืืืืืืืช ืคืืืช ื ืคืืฆืืช ืืืฉืจืืช ืคื ืืืืช ืขืืืจ ืืืขื ื ื ืชืื ืื ืืืฉืจ ืขืืืจ ืืื ืืกื ื ืชืื ืื.
ืคืืคืืืจื ืืืชืจ ืืื ืืกืช ื ืชืื ืื
ืืืจืฃ ืฉืืืื ืืฆืื ืืืืืช ืืคืชื ืขื ืืืื ืืืืฆืข ืฉื ืืืชืจ ื-10% ืื ืคืืืช ื-10%.
ืืืืืืื ืืืืืืื ืืืืชืจ ืืชืืืจืืช ืืืืืช ืืืคืชื ืืื ืืื ืืก ื ืชืื ืื ืืืืขื ื ืชืื ืื
AWS ืืฆืืื ืืช ืืขืืืื ืืืฉืืขืืชืืช ืืืืชืจ: ืืื ืืกืช ื ืชืื ืื ืืื ืืืคืืขื ื-25% ืืืืคื ืงืืืข ืืืชืจ ืืืฉืจ ื-Data Science (ื-45% ื-20% ืืกื ืืืฉืจืืช ืืคื ืืืืช, ืืืชืืื). ืืืืื ืืืจืืฉ!
ืืคื ืืื ืืืชื ื ืชืื ืื ืืืฆืืช ืืขื ืฉืื ื - ืืืจืฃ, ืืชืืฆืืืช ืขืืืจ ืืืชื ืืืืช ืืคืชื ืืืฉืจืืช ืืคื ืืืืช ืืชืคืงืื ืืื ืืก ื ืชืื ืื ืืืืขื ื ืชืื ืื ืืืืงืืืช ืื ืืฆื ืื.
ืืืืืืื ืืืืืืื ืืืืชืจ ืืชืืืจืืช ืืืืืช ืืืคืชื ืืื ืืื ืืก ื ืชืื ืื ืืืืขื ื ืชืื ืื
ืืงืคืืฆื ืืืืืื ืืืื ืฉืฆืืื ืชื ืืืืชื ื-Spark - ืืื ืืก ื ืชืื ืื ืฆืจืื ืืขืืื ืืขืชืื ืงืจืืืืช ืขื ืืื ืืืื.
ืคืืืช ืคืืคืืืจื ืืื ืืกืช ื ืชืื ืื
ืขืืฉืื ืืืื ื ืจืื ืืืื ืืื ืืืืืืืช ืคืืืช ืคืืคืืืจืืืช ืืืฉืจืืช ืคื ืืืืช ืฉื ืืื ืืก ื ืชืื ืื.
ืืืจืืื ืืืื ืืืืชืจ ืืืฉืืืื ืืืืืจ ืืืขื ืื ืชืื ืื ืืื ืื
ืืืืงืฉ ืื ืืื ืืกืช ื ืชืื ืื ืืื ืืืืขื ืื ืชืื ืื
ืืฉ ืืฆืืื ืฉืฉืืื ื ืืชืื ืขืฉืจืช ืืขืืืืช ืืจืืฉืื ืืช ืืฉืชื ืืกืืื ืืืืช. SQL, Python, Spark, AWS, Java, Hadoop, Hive ื-Scala ื ืื ืกื ืืขืฉืืจืืื ืืจืืฉืื ื ืื ืืชืขืฉืืืช ืื ืืกืช ืื ืชืื ืื ืืื ืืชืขืฉืืืช ืืืขื ืื ืชืื ืื. ืืืจืฃ ืืืื ื ืืชื ืืจืืืช ืืช ืืืฉ ืขืฉืจื ืืืื ืืืืืืืช ืืคืืคืืืจืืืช ืืืืชืจ ืืงืจื ืืขืกืืงื ืืื ืืกื ื ืชืื ืื, ืืืฆืืื ืฉืืขืืจ ืืืฉืจืืช ืืคื ืืืืช ืฉืืื ืขืืืจ ืืืขื ื ื ืชืื ืื.
ืืืืฆืืช
ืื ืืชื ืจืืฆื ืืืืื ืก ืืื ืืกืช ื ืชืื ืื, ืืืืชื ืืืืืฅ ืื ืืฉืืื ืืืื ืืืืืืืช ืืืืืช - ืื ื ืืคืจื ืืืชื ืืคื ืกืืจ ืขืืืคืืช ืืฉืืขืจ.
ืืื SQL. ืื ื ื ืืื ืืืืืื PostgreSQL ืื ืื ืงืื ืคืชืื, ืคืืคืืืจื ืืืื ืืงืืืื, ืื ืืฆื ืืฉืื ืฆืืืื. ื ืืชื ืืืืื ืืืฆื ืืืฉืชืืฉ ืืฉืคื ืืืกืคืจ My Memorable SQL - ืืจืกืช ืืคืืืืื ืฉืื ืืืื ื
ืืืกืืจ ืคืืืชืื, ืื ืื ืื ืืจืื ืืื ืืืจืืงืืจ. My Memorable Python ืชืืื ื ืืืืืื ืืืชืืืืื. ื ืืชื ืืจืืืฉ ืืืชื ื
ืืืืจ ืฉืชืืืจ ืืช Python, ืืืฉื ื- pandas, ืกืคืจืืืช Python ืืืฉืืฉืช ืื ืืงืื ืืขืืืื ื ืชืื ืื. ืื ืืชื ืฉืืืคืื ืืขืืื ืืืืจื ืฉืืืจืฉืช ืืืืืช ืืชืืื ื-Python (ืืื ืจืืื), ืืชื ืืืืืื ืืืืืช ืืืืืื ืฉืืืข ืืคื ืืืช ืืื ื ืืืจืืจืช ืืืื. ืืจืืข ืื ื ืืกืืื ืืืจืื ืืืื ืืขืืืื ืขื ืคื ืืืช - ืืชื ืืืื
ืืืกืืจ AWS. ืื ืืชื ืจืืฆื ืืืืืช ืืื ืืก ื ืชืื ืื, ืืชื ืื ืืืื ืืื ืคืืืคืืจืืช ืขื ื ืืืืกื, ื-AWS ืืื ืืคืืคืืืจื ืฉืืื. ืืงืืจืกืื ืขืืจื ืื ืืืื
ืื ืืืจ ืืฉืืืชื ืืช ืื ืืจืฉืืื ืืื ืืืจืฆืื ืื ืืฆืืื ืขืื ืืืชืจ ืืขืื ื ืืืขืกืืงืื ืืืื ืืก ื ืชืื ืื, ืื ื ืืฆืืข ืืืืกืืฃ ืืช Apache Spark ืืขืืืื ืขื ืืื ืืืื. ืืืจืืช ืฉืืืืงืจ ืฉืื ืขื ืืฉืจืืช ืคื ืืืืช ืฉื ืืืขื ื ื ืชืื ืื ืืจืื ืืจืืื ืืขื ืืื, ืืงืจื ืืื ืืกื ื ืชืื ืื ืื ืขืืืื ืืืคืืข ืืืขื ืืื ืืงืื ืคื ืื ืฉื ื.
ืืืกืืฃ
ืื ื ืืงืืื ืฉืืฆืืช ืืช ืืกืงืืจื ืืืืืืช ืืื ืฉื ืืืื ืืืืืืืช ืืืืืงืฉืืช ืืืืชืจ ืืืื ืืกื ื ืชืื ืื ืฉืืืืฉืืช. ืื ืืชื ืชืืื ืืื ืืกืชืืจืืช ืืฉืจืืช ืื ืืืกืืื, ืงืจื
ืืงืืจ: www.habr.com