12 онлайн-курсів з Data Engineering

12 онлайн-курсів з Data Engineering
За даними Statista, до 2025 року обсяг ринку big data зросте до 175 зетабайт проти 41 у 2019 році.графік). Щоб отримати роботу у цій сфері, потрібно розуміти, як працювати з великими даними, що зберігаються у хмарі. Cloud4Y підготував список з 12 платних та безкоштовних курсів з інжинірингу даних, які розширять ваші знання у цій сфері та можуть стати гарною відправною точкою на шляху до хмарних сертифікацій.

Передмова

Що таке фахівець із обробки даних (data engineer)? Це людина, яка відповідає за створення та підтримку архітектури даних у Data Science-проекті. У його обов'язки може входити забезпечення безперебійного потоку даних між сервером і додатком, інтеграція нового програмного забезпечення для управління даними, вдосконалення основних процесів даних і створення конвеєрів даних.

Є величезна кількість технологій та інструментів, якими повинен володіти data engineer, щоб працювати з хмарними обчисленнями, сховищами даних, ETL (extraction, transformation, loading) та ін. знань. У нашому списку є курси для новачків та досвідчених фахівців. Вибирайте, що підходить саме вам.

1. Data Engineering Nanodegree Certification (Udacity)

Ви навчитеся проектувати моделі даних, створювати сховища даних та озера даних, автоматизувати конвеєри даних та працювати з масивами датасетів. Наприкінці програми ви перевірите нові навички, завершивши проект Capstone.

Тривалість: 5 місяців, 5 годин на тиждень
Мова: англійська
Ціна: $ 1695
Рівень: початковий

2. Become a Data Engineer Certification (Coursera)

Навчають з азів. Ви можете поетапно розвиватись, використовуючи лекції та практичні проекти для роботи над своїми навичками. До кінця навчання ви будете готові працювати з ML та великими даними. Рекомендується знати Python хоч би на мінімальному рівні.

Тривалість: 8 місяців, 10 годин на тиждень
Мова: англійська
Ціна😕
Рівень: початковий

3. Become a Data Engineer: Mastering the Concepts (Навчання LinkedIn)

Ви розвинете навички проектування даних та навички DevOps, навчитеся створювати програми для Big Data, створювати конвеєри даних, обробляти програми в реальному часі з використанням Hazelcast та бази даних Hadoop.

Тривалість: залежить від вас
Мова: англійська
Ціна: перший місяць - безкоштовно
Рівень: початковий

4. Data Engineering Courses (EDX)

Тут зібрана серія програм, які знайомлять вас з data engineering та навчають розробці аналітичних рішень. Курси поділяються на категорії в залежності від рівня складності, так що ви можете вибрати один відповідно до вашого рівня досвіду. У процесі навчання ви навчитеся використовувати Spark, Hadoop, Azure та керувати корпоративними даними.

Тривалість: залежить від вас
Мова: англійська
Ціна: залежить від обраного курсу
Рівень: початковий, середній, просунутий

5. Data Engineer (DataQuest)

Цей курс варто вибрати, якщо у вас є досвід роботи з Python і ви хочете поглибити свої знання та побудувати кар'єру спеціаліста з обробки даних. Ви навчитеся будувати конвеєри даних, використовуючи Python та pandas, завантажувати великі набори даних у БД Postgres після очищення, перетворення та перевірки.

Тривалість: залежить від вас
Мова: англійська
Ціна: залежить від форми передплати
Рівень: початковий, середній

6. Data Engineering with Google Cloud (Coursera)

Цей курс допоможе вам придбати навички, необхідні для побудови кар'єри у сфері роботи з великими даними. Наприклад, робота з BigQuery, Spark. Ви отримаєте знання, які стануть у нагоді для підготовки до визнаної в галузі сертифікації Google Cloud Professional Data Engineer.

Тривалість: 4 місяці
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий, середній

7. Data Engineering, Big Data on Google Cloud Platform (Coursera)

Цікавий курс, що дає практичні знання про системи обробки даних у GCP. Під час занять ви дізнаєтесь, як спроектувати системи, перш ніж розпочати процес розробки. Крім цього, ви також аналізуватимете як структуровані, так і неструктуровані дані, застосовувати автоматичне масштабування і застосовувати методи ML для отримання інформації.

Тривалість: 3 місяці
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий, середній

8. UC San Diego: Big Data Specialization (Coursera)

Курс заснований на використанні інфраструктури Hadoop та Spark та застосуванні цих методів обробки великих даних у процесі ML. Ви ознайомитеся з основами використання Hadoop з MapReduce, Spark, Pig та Hive. Дізнаєтесь, як можна будувати прогнозні моделі та використовувати аналітику графів для моделювання проблем. Зазначимо, що для цього курсу не потрібний досвід програмування.

Тривалість: 8 місяців по 10 годин на тиждень
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий

9. Taming Big Data With Apache Spark and Python (Udemy)

Ви дізнаєтесь, як використовувати потокову структуру та кадри даних у Spark3, отримаєте уявлення про те, як використовувати сервіс Elastic MapReduce від Amazon для роботи з вашим кластером у Hadoop. Навчіться визначати проблеми при аналізі великих даних і зрозумієте, як бібліотеки GraphX ​​працюють із мережним аналізом і як ви можете використовувати MLlib.

Тривалість: залежить від вас
Мова: англійська
Ціна: від 800 рублів до $149,99 (як пощастить)
Рівень: початковий, середній

10. PG Program in Big Data Engineering (upGrad)

Цей курс дасть вам уявлення про те, як працює Aadhaar, як Facebook персоналізує стрічку новин та як взагалі можна використовувати Data Engineering. Ключовими темами стануть обробка даних (у тому числі обробка реального часу), MapReduce, аналітика великих даних.

Тривалість: 11 місяців
Мова: англійська
Ціна: в районі $3000
Рівень: початковий

11. Професія Data Scientist (Скринька навичок)

Ви навчитеся програмувати на Python, вивчіть фреймворки для навчання нейронних мереж Tensorflow та Keras. Освойте бази даних MongoDB, PostgreSQL, SQLite3, навчитеся працювати з бібліотеками Pandas, NumPy та Matpotlib.

Тривалість: 300 годин навчання
Мова: російська
Ціна: перші півроку безкоштовно, потім 3900 рублів на місяць
Рівень: початковий

12. Data Engineer 7.0 (New Professions Lab)

На вас чекає глибоке вивчення Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-архітектури та kappa-архітектури. Ви навчитеся підключати інструменти один до одного, формуючи пайплайни, отримуючи baseline-рішення. Для навчання потрібно мінімальне знання Python 3.

Тривалість: 21 заняття, 7 тижнів
Мова: російська
Ціна: від 60 000 до 120 000 рублів
Рівень: початковий

Якщо у вас є бажання додати ще один хороший курс, можете відписатися в коментарях або в ЛЗ. Ми доповнимо пост.

Що ще корисного можна почитати у блозі Cloud4Y

Яка геометрія Всесвіту?
Великдень на топографічних картах Швейцарії
Спрощена та дуже коротка історія розвитку «хмар»
Як «зламався» банк
Комп'ютерні бренди 90-х, ч.3, заключна

Підписуйтесь на наш Telegram-Канал, щоб не пропустити чергову статтю Пишемо не частіше двох разів на тиждень і лише у справі. Також нагадуємо, що 21 травня о 15:00 ми проведемо вебінар на тему «Інформаційна безпека бізнесу під час роботи на віддаленні». Якщо ви хочете розуміти, як захистити чутливу та корпоративну інформацію під час роботи співробітників з дому – реєструйтесь!

Джерело: habr.com

Додати коментар або відгук