12 анлайн-курсаў па Data Engineering

12 анлайн-курсаў па Data Engineering
Па дадзеных Statista, да 2025 года аб'ём рынку big data вырасце да 175 зэтабайт супраць 41 у 2019 годзе.графік). Каб атрымаць працу ў гэтай сферы, трэба разумець, як працаваць з вялікімі дадзенымі, якія захоўваюцца ў воблаку. Cloud4Y падрыхтаваў спіс з 12 платных і бясплатных курсаў па інжынірынгу дадзеных, якія пашыраць вашыя веды ў гэтай сферы і могуць стаць добрай адпраўной кропкай на шляху да хмарных сертыфікацыям.

Прадмова

Што такое спецыяліст па апрацоўцы даных (data engineer)? Гэта чалавек, які адказвае за стварэнне і падтрымку архітэктуры даных у Data Science-праекце. У яго абавязкі можа ўваходзіць забеспячэнне бесперабойнага струменя дадзеных паміж серверам і дадаткам, інтэграцыя новага ПЗ для кіравання дадзенымі, удасканаленне асноўных працэсаў дадзеных і стварэнне канвеераў дадзеных.

Ёсць велізарная колькасць тэхналогій і прылад, якімі павінен валодаць data engineer, каб працаваць з хмарнымі вылічэннямі, сховішчамі дадзеных, ETL (extraction, transformation, loading) і інш. Прычым колькасць патрабаваных навыкаў увесь час расце, таму дата-інжынеру неабходна рэгулярна папаўняць свой багаж ведаў. У нашым спісе ёсць курсы для навічкоў і вопытных спецыялістаў. Выбірайце, што падыходзіць менавіта вам.

1. Data Engineering Nanodegree Certification (Udacity)

Вы навучыцеся праектаваць мадэлі дадзеных, ствараць сховішчы дадзеных і азёры дадзеных, аўтаматызаваць канвееры дадзеных і працаваць з масівамі датасетаў. У канцы праграмы вы праверыце свае новыя навыкі, завяршыўшы праект Capstone.

Працягласць: 5 месяцаў, 5 гадзін у тыдзень
Мова: англійская
Кошт: $ 1695
Узровень: пачатковы

2. Become a Data Engineer Certification (Coursera)

Вучаць з асноў. Вы можаце паэтапна развівацца, выкарыстоўваючы лекцыі і практычныя праекты для працы над сваімі навыкамі. Да канца навучання вы будзеце гатовы працаваць з ML і вялікімі дадзенымі. Рэкамендуецца ведаць Python хаця б на мінімальным узроўні.

Працягласць: 8 месяцаў, 10 гадзін у тыдзень
Мова: англійская
Кошт😕
Узровень: пачатковы

3. Become a Data Engineer: Mastering the Concepts (LinkedIn навучанне)

Вы разаўецца навыкі праектавання дадзеных і навыкі DevOps, навучыцеся ствараць прыкладанні для Big Data, ствараць канвееры дадзеных, апрацоўваць прыкладанні ў рэальным часе з выкарыстаннем Hazelcast і базы дадзеных Hadoop.

Працягласць: залежыць ад вас
Мова: англійская
Кошт: першы месяц - бясплатна
Узровень: пачатковы

4. Data Engineering Courses (EDX)

Тут сабрана серыя праграм, якія знаёмяць вас з data engineering і вучаць распрацоўцы аналітычных рашэнняў. Курсы дзеляцца на катэгорыі ў залежнасці ад узроўню складанасці, так што вы можаце выбраць адзін у адпаведнасці з вашым узроўнем вопыту. У працэсе навучання вы навучыцеся выкарыстоўваць Spark, Hadoop, Azure і кіраваць карпаратыўнымі дадзенымі.

Працягласць: залежыць ад вас
Мова: англійская
Кошт: залежыць ад выбранага курса
Узровень: пачатковы, сярэдні, прасунуты

5. Data Engineer (DataQuest)

Гэты курс варта выбраць, калі ў вас ёсць досвед працы з Python і вы хочаце паглыбіць свае веды і пабудаваць кар'еру спецыяліста па апрацоўцы дадзеных. Вы навучыцеся будаваць канвееры дадзеных, выкарыстоўваючы Python і pandas, загружаць вялікія наборы дадзеных у БД Postgres пасля ачысткі, пераўтварэнні і праверкі.

Працягласць: залежыць ад вас
Мова: англійская
Кошт: залежыць ад формы падпіскі
Узровень: пачатковы, сярэдні

6. Data Engineering with Google Cloud (Coursera)

Гэты курс дапаможа вам набыць навыкі, неабходныя для пабудовы кар'еры ў галіне працы з вялікімі дадзенымі. Напрыклад, праца з BigQuery, Spark. Вы атрымаеце веды, якія спатрэбяцца для падрыхтоўкі да прызнанай у галіне сертыфікацыі Google Cloud Professional Data Engineer.

Працягласць: 4 месяцы
Мова: англійская
Кошт: пакуль бясплатна
Узровень: пачатковы, сярэдні

7. Data Engineering, Big Data on Google Cloud Platform (Coursera)

Цікавы курс, які дае практычныя веды аб сістэмах апрацоўкі дадзеных у GCP. Падчас заняткаў вы даведаецеся, як спраектаваць сістэмы, перш чым прыступіць да працэсу распрацоўкі. Акрамя гэтага, вы таксама будзеце аналізаваць як структураваныя, так і неструктураваныя дадзеныя, прымяняць аўтаматычнае маштабаванне і прымяняць метады ML для здабывання інфармацыі.

Працягласць: 3 месяцы
Мова: англійская
Кошт: пакуль бясплатна
Узровень: пачатковы, сярэдні

8. UC San Diego: Big Data Specialization (Coursera)

Курс заснаваны на выкарыстанні інфраструктуры Hadoop і Spark і ўжыванні гэтых метадаў апрацоўкі вялікіх дадзеных у працэсе ML. Вы пазнаёміцеся з асновамі выкарыстання Hadoop з MapReduce, Spark, Pig і Hive. Даведаецеся, як можна будаваць прагнозныя мадэлі і выкарыстоўваць аналітыку графаў для мадэлявання праблем. Адзначым, што для гэтага курса не патрабуецца досвед праграмавання.

Працягласць: 8 месяцаў па 10 гадзін у тыдзень
Мова: англійская
Кошт: пакуль бясплатна
Узровень: пачатковы

9. Taming Big Data With Apache Spark and Python (Udemy)

Вы даведаецеся, як выкарыстоўваць струменевую структуру і фрэймы дадзеных у Spark3, атрымаеце ўяўленне аб тым, як выкарыстоўваць сэрвіс Elastic MapReduce ад Amazon для працы з вашым кластарам у Hadoop. Навучыцеся вызначаць праблемы пры аналізе вялікіх дадзеных і зразумееце, як бібліятэкі GraphX ​​працуюць з сеткавым аналізам і як вы можаце выкарыстоўваць MLlib.

Працягласць: залежыць ад вас
Мова: англійская
Кошт: ад 800 рублёў да $149,99 (як пашанцуе)
Узровень: пачатковы, сярэдні

10. PG Program in Big Data Engineering (уверхГрад)

Гэты курс дасць вам уяўленне аб тым, як працуе Aadhaar, як Facebook персаналізуецца стужку навін і як наогул можна выкарыстоўваць Data Engineering. Ключавымі тэмамі стануць апрацоўка даных (у тым ліку апрацоўка ў рэальным часе), MapReduce, аналітыка вялікіх даных.

Працягласць: 11 месяцаў
Мова: англійская
Кошт: у раёне $3000
Узровень: пачатковы

11. Прафесія Data Scientist (Скрыня навыкаў)

Вы навучыцеся праграмаваць на Python, вывучыце фрэймворкі для навучання нейронавых сетак Tensorflow і Keras. Асвоіце базы дадзеных MongoDB, PostgreSQL, SQLite3, навучыцеся працаваць з бібліятэкамі Pandas, NumPy і Matpotlib.

Працягласць: 300 гадзін навучання
Мова: руская
Кошт: першыя паўгода бясплатна, затым 3900 рублёў за месяц
Узровень: пачатковы

12. Data Engineer 7.0 (New Professions Lab)

Вас чакае глыбокае вывучэнне Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-архітэктуры і kappa-архітэктуры. Вы навучыцеся падлучаць прылады сябар да сябра, фармуючы пайплайны, атрымліваючы baseline-рашэнне. Для вучобы патрабуецца мінімальнае веданне Python 3.

Працягласць: 21 занятак, 7 тыдняў
Мова: руская
Кошт: ад 60 000 да 120 000 рублёў
Узровень: пачатковы

Калі ў вас ёсць жаданне дадаць у спіс яшчэ адзін добры курс, можаце адпісацца ў каментарах ці ў ЛС. Мы дапоўнім пост.

Што яшчэ карыснага можна пачытаць у блогу Cloud4Y

Якая геаметрыя Сусвету?
Вялікдзень на тапаграфічных картах Швейцарыі
Спрошчаная і вельмі кароткая гісторыя развіцця "аблокаў"
Як «зламаўся» банк
Кампутарныя брэнды 90-х, ч.3, заключная

Падпісвайцеся на наш Тэлеграма-канал, каб не прапусціць чарговы артыкул. Пішам не часцей за два разы на тыдзень і толькі па справе. Таксама нагадваем, што 21 траўня ў 15:00 (мск) мы правядзём вебинар на тэму «Інфармацыйная бяспека бізнэсу пры працы на выдаленні». Калі вы хочаце разумець, як абараніць адчувальную і карпаратыўную інфармацыю пры працы супрацоўнікаў з дому - рэгіструйцеся!

Крыніца: habr.com

Дадаць каментар