αααααΆα ββStatista αα
ααααΆα 2025 ααα αααααΈααααΆααα·ααααααααααΉαααΎαα‘αΎαααα 175 zettabytes ααΎαααααΉα 41 αααα»αααααΆα 2019 (
αα»ααααααΆ
ααΎαα·ααααααα·ααααααααΊααΆα’αααΈ? αααααΊααΆαα»αααααααααα½ααα»αααααΌαααΎααΆααααααΎα αα·ααααααααΆααααΆαααααααααα·αααααααα αααα»ααααααααα·ααααΆααΆααααααα·ααααααα αααα½ααα»αααααΌαα’αΆα αα½ααααα αΌαααΆαααΆααΆααα αΌααα·αααααααααΌααααΆααααΆαααΈααα αα·ααααααα·ααΈ ααΆααα½ααααα αΌααααααα·ααΈααααααααααα·ααααααααααΈ ααΆααααααα’ααααΎαααΆααα·ααααααααΌαααααΆα αα·αααΆααααααΎαααααααααα αΌααα·ααααααα
ααΆααα αα αααα·ααααΆ αα·αα§ααααααα½αα ααα½αααααααα·ααααααα·ααααααααααΌαααααααΆααααααΆα ααΎααααΈααααΎααΆαααΆαα½α cloud computing, data warehouse, ETL (extraction, transformation, loading) ααΆααΎα α ααΌα ααααβαα·αααααβαα·ααααααβααααΌαβαααααβααααααβααΌαβα ααααβααΉαβααααβαααα½αβααΆβαααα αΆαα αααααΈααααααΎααα½ααααα αΌααααααα·ααααΆαααααΆααα’αααα αΆααααααΎαααααΌα αα·αα’αααααααΆααααααΆααααα·αααααα ααααΎαααΎαα’αααΈαααααααΉαα’αααα
1. αα·ααααΆααααααα Nanodegree αα·ααααααααα·αααααα (
α’αααααΉααααααΈαααααα ααΆααααΌαα·αααααα αααααΎαααααΆαααα·αααααα αα·αααΉααα·αααααα ααααααααααααα·ααααααααααααα·αααααα αα·αααααΎααΆαααΆαα½αα’αΆαααααααα»ααα·ααααααα αα α α»ααααα αααααααααα·ααΈ α’αααααΉαααΆαααααααααΆαααααΈααααα’αααααααααα αααααααα Capstone α
αααααα: 5 αα 5 αααααααα»ααα½ααααααΆα α
ααΆααΆα ααΆααΆα’ααααααα
ααααα: $ 1695
ααααα·αα ααααΌα
2. ααααΆαααΆαα·ααααααα·αααααααα·ααααΆααααααα (
αα½αααααααααααΈααΌαααααΆαα α’αααα’αΆα ααααΎαααΆααα½αααα αΆααααααα½αα αααααααΎααΆααααααα αα·αααααααααααα ααΎααααΈααααΎααΆαααΎααααΆαααααα’αααα αα α α»ααααα ααααααΆαααααα»ααααααΆα α’αααααΉαααααααααα½αααΎααααΈααααΎααΆαααΆαα½α ML αα·ααα·ααααααααα ααΆααααΌαααΆαααααΆαα’ααααααΆαα Python αααΆαα αα ααΆαααααα»αααααα·αα’αααααααΆα
αααααα: 8 αα 10 αααααααα»ααα½ααααααΆα α
ααΆααΆα ααΆααΆα’ααααααα
αααααπ
ααααα·αα ααααΌα
3. Become a Data Engineer: Mastering the Concepts (
α’αααααΉαα’αα·ααααααααΆααα·ααααααααα·αααααα αα·α DevOps αααααΈαααααααααΎααααααα·ααΈ Big Data αααααΎαααααααααα αΌααα·αααααα ααααΎαααΆααααααα·ααΈαααα»ααααααααΆααΆααααααααααααααΎ Hazelcast αα·αααΌαααααΆααα·ααααααα
αααααα: α’αΆαααααβαα
βααΎβα’ααα
ααΆααΆα ααΆααΆα’ααααααα
αααααα ααααααΌα - α₯ααα·ααααα
ααααα·αα ααααΌα
4. αααααα·ααααααααα·αααααα (
αααααΊααΆαααααα·ααΈαα½αα ααα½ααααααααΆαα’αααα’αααΈαα·ααααααααα·αααααα αα·αααααααα’αααααΈαααααααααΎααααααααααΆααα·ααΆαα αααααα·ααααΆααααΌαααΆααααα αααα ααΆαααααααααααα’ααααΎααααα·αααααΆα ααΌα ααααα’αααα’αΆα ααααΎαααΎααα½ααα ααΆαααααα·ααααα·αααααααααα’αααα αααα»αα’αα‘α»ααααααααα»ααααααΆα α’αααααΉααααααααΎ Spark, Hadoop, Azure αα·αααααααααααα·ααααααααΆααΈαααααα
αααααα: α’αΆαααααβαα
βααΎβα’ααα
ααΆααΆα ααΆααΆα’ααααααα
αααααα α’αΆαααααααΎαααααα·ααααΆαααααΆαααααΎαααΎα
ααααα·α: α
αΆααααααΎα, ααααα, ααααα·αααααα
5. αα·ααααααα·αααααα (
αααααα·ααααΆαααααΊααΆααααααααα½αααααααα·αααΎα’αααααΆααααα·αααααααΆαα½α Python α αΎαα αααααααΎαα ααααααΉαααααα’ααα αα·ααααααΎαα’αΆααΈαααΆα’ααααα·ααααΆααΆααααααα·ααααααα α’αααααΉααααααΈαααααααααΎαααααααααα αΌααα·αααααααααααααΎ Python αα·α pandas αααα»ααααα»ααα·αααααααααα αααα»αααΌαααααΆααα·αααααα Postgres αααααΆααααΈαααα’αΆα ααααααα αα·ααααααααααΆααα
αααααα: α’αΆαααααβαα
βααΎβα’ααα
ααΆααΆα ααΆααΆα’ααααααα
αααααα α’αΆαααααααΎααααααααΆα
ααααα·α: α
αΆααααααΎα, ααααα
6. αα·ααααααααα·ααααααααΆαα½α Google Cloud (
αααααα·ααααΆαααααΉααα½αα’αααα±ααααα½αααΆαααααΆααααα’αααααααΌαααΆαααΎααααΈαααΆαα’αΆααΈααα αααα»ααα·ααααααααα α§ααΆα ααα ααααΎααΆαααΆαα½α BigQuery, Spark α α’αααααΉαααα½αααΆαα ααααααΉααααα’αααααααΌαααΆαααΎααααΈαααα ααααααΆαααα·ααααΆαααααα Google Cloud Professional Data Engineer αααααα½αααααΆαααααα§ααααΆα ααααα
αααααα: 4 αα
ααΆααΆα ααΆααΆα’ααααααα
αααααα α₯ααα·αααααα₯α‘αΌαααα
ααααα·α: α
αΆααααααΎα, ααααα
7. αα·ααααααααα·αααααα αα·αααααααααα
ααΎ Google Cloud Platform (
αααααα·ααααΆαα½αα±ααα αΆααα’αΆααααααααααααααααΌαα ααααααΉαααΆαααααααααααααααααααααΎαααΆααα·αααααααα αααα»α GCP α αααα»αα’αα‘α»ααααααααΆαα α’αααααΉααααααΈαααααα ααΆαααααααα αα»ααααα αΆααααααΎαααααΎαααΆαα’αα·ααααααα ααΎαααΈαααααα α’αααααααΉααα·ααΆαααΆαααα·αααααααααααΆααα ααΆαααααααα αα·ααα·αααΆααα ααΆαααααααα α’αα»ααααααΆαααααΎααΆαααααααΆααααααααααααααααα· αα·αα’αα»αααααα αα ααααα ML ααΎααααΈααΆαααααααααΆαα
αααααα: 3 αα
ααΆααΆα ααΆααΆα’ααααααα
αααααα α₯ααα·αααααα₯α‘αΌαααα
ααααα·α: α
αΆααααααΎα, ααααα
8. UC San Diego: α―αααααα·αααααααα (
αααααα·ααααΆααΊααα’ααααΎααΆαααααΎααααΆααααααααααα Hadoop αα·α Spark αα·αα’αα»αααααα αα ααααααα·ααααααααααΆααααααα αααα»αααααΎαααΆα ML α α’αααααΉααααααΈααΌαααααΆαααααΉαααααΆαααααΎααααΆαα Hadoop ααΆαα½α MapReduce, Spark, Pig αα·α Hiveα ααααααααααΈαααααααααΎαααααΌααααΆαααα αα·αααααΎααΆααα·ααΆαααααΆα ααααΎααααΈαααααααΆααααα αΆααααΌα ααΌαα αααΆαααΆαααααα·ααααΆααααα·ααααααΌαα±ααααΆααααα·αααααααααααααααα·ααΈααΆαα½αα‘αΎαα
αααααα: 8 αα 10 αααααααα»ααα½ααααααΆα α
ααΆααΆα ααΆααΆα’ααααααα
αααααα α₯ααα·αααααα₯α‘αΌαααα
ααααα·αα ααααΌα
9. ααααααααααα·ααααααααααΆαα½α Apache Spark αα·α Python (
α’αααααΉααααααΈααααααααΎααααΆαααα ααΆααααααααααααααΈα αα·αααα»ααα·αααααααα αααα»α Spark3 αα·αααα½αααΆαααΆααααααΉαααΈααααααααΎααααΆααααααΆαααα Elastic MapReduce αααααααα»αα αα»α Amazon ααΎααααΈααααΎααΆαααΆαα½ααααα»α Hadoop ααααα’αααα αααααΎααααΈααααααααα αΆαααα»αααΆααα·ααΆααα·αααααααα αα·ααααααΈααααααααααααΆααα GraphX ββααααΎααΆαααΆαα½αααΆααα·ααΆααααααΆα αα·ααααααααα’αααα’αΆα ααααΎ MLlib α
αααααα: α’αΆαααααβαα
βααΎβα’ααα
ααΆααΆα ααΆααΆα’ααααααα
ααααα: ααΈ 800 rubles αα
$149,99 (α’αΆαααααααΎααααΆαααααα’ααα)
ααααα·α: α
αΆααααααΎα, ααααα
10. αααααα·ααΈ PG αααα»ααα·ααααααααα·αααααααα (
αααααα·ααααΆαααααΉααααααα±ααα’αααααΌαααΆααααααΉαα’αααΈααααααα Aadhaar ααααΎααΆα ααααααα Facebook αααααααααααΆαααααΆαααααα½α αα·ααααααα·ααααααααα·ααααααα’αΆα ααααΌαααΆαααααΎααΆααΌαα α αααααΆαααααααΆαααααΉαααΆααααΎαααΆααα·αααααα (αα½αααΆααααααΎαααΆααααααααΆααΆααααααα) MapReduce ααΆααα·ααΆααα·ααααααααα
αααααα: 11 αα
ααΆααΆα ααΆααΆα’ααααααα
αααααα αααα αα α£α α α αα»ααααΆα
ααααα·αα ααααΌα
11. α’ααααα·ααααΆααΆααααααα·ααααααα’αΆααΈα (
α’αααααΉααααααααααααααα·ααΈαα αααα»α Python αα·ααααΆααααααααααααααΆααααΆαααααα»ααααααΆααααααΆααααααααααΆα Tensorflow αα·α Keras α ααααΎααΆααα αΆααααΎααΌαααααΆααα·αααααα MongoDB, PostgreSQL, SQLite3 αααααααΎααΆαααΆαα½ααααααΆααα Pandas, NumPy αα·α Matpotlib α
αααααα: 300 ααααααααΆαααααα»ααααααΆα
ααΆααΆα αα»αααααΈ
αααααα ααααΆααα½αααααααΌααααα₯ααα·ααααα αααααΆαααα 3900 rubles αααα»ααα½ααα
ααααα·αα ααααΌα
12. αα·ααααααα·αααααα 7.0 (
α’αααααΉαααα½αααΆαααΆααα·ααααΆαααΈααααα α’αααΈ Kafka, HDFS, ClickHouse, Spark, Airflow, lambda architecture αα·α kappa architectureα α’αααααΉααααααΈααααααααΆααα§ααααααα ααααΆαα αα·ααα αα αααααΎαααααα ααα½αααΆααααααααααΆαααΌαααααΆαα ααΎααααΈαα·ααααΆ α ααααααΉαα’αααααααΆαα Python 3 ααααΌαααΆαααΆαααΆαα
αααααααααααα α’α‘ ααααα α§ αααααΆα α
ααΆααΆα αα»αααααΈ
ααααα: ααΈ 60 αα
000 rubles
ααααα·αα ααααΌα
ααααα·αααΎα’αααα αααααααααααααα·ααααΆααα’αα½ααααααααααα αααα»ααααααΈ α’αααα’αΆα αααααΆααα αααα»αααα·ααααα α¬αα αααα»α PM α ααΎαααΉαα’αΆααααααααααΆαα
ααΎα’αααα’αΆα
α’αΆαα’αααΈααααα
ααΎααααα?
β
β
β
β
β
ααΆααααα
αΆαααααααΎαα
ααααα: www.habr.com