За даними Statista, до 2025 року обсяг ринку big data зросте до 175 зетабайт проти 41 у 2019 році.
Передмова
Що таке фахівець із обробки даних (data engineer)? Це людина, яка відповідає за створення та підтримку архітектури даних у Data Science-проекті. У його обов'язки може входити забезпечення безперебійного потоку даних між сервером і додатком, інтеграція нового програмного забезпечення для управління даними, вдосконалення основних процесів даних і створення конвеєрів даних.
Є величезна кількість технологій та інструментів, якими повинен володіти data engineer, щоб працювати з хмарними обчисленнями, сховищами даних, ETL (extraction, transformation, loading) та ін. знань. У нашому списку є курси для новачків та досвідчених фахівців. Вибирайте, що підходить саме вам.
1. Data Engineering Nanodegree Certification (
Ви навчитеся проектувати моделі даних, створювати сховища даних та озера даних, автоматизувати конвеєри даних та працювати з масивами датасетів. Наприкінці програми ви перевірите нові навички, завершивши проект Capstone.
Тривалість: 5 місяців, 5 годин на тиждень
Мова: англійська
Ціна: $ 1695
Рівень: початковий
2. Become a Data Engineer Certification (
Навчають з азів. Ви можете поетапно розвиватись, використовуючи лекції та практичні проекти для роботи над своїми навичками. До кінця навчання ви будете готові працювати з ML та великими даними. Рекомендується знати Python хоч би на мінімальному рівні.
Тривалість: 8 місяців, 10 годин на тиждень
Мова: англійська
Ціна😕
Рівень: початковий
3. Become a Data Engineer: Mastering the Concepts (
Ви розвинете навички проектування даних та навички DevOps, навчитеся створювати програми для Big Data, створювати конвеєри даних, обробляти програми в реальному часі з використанням Hazelcast та бази даних
Тривалість: залежить від вас
Мова: англійська
Ціна: перший місяць - безкоштовно
Рівень: початковий
4. Data Engineering Courses (
Тут зібрана серія програм, які знайомлять вас з data engineering та навчають розробці аналітичних рішень. Курси поділяються на категорії в залежності від рівня складності, так що ви можете вибрати один відповідно до вашого рівня досвіду. У процесі навчання ви навчитеся використовувати Spark, Hadoop, Azure та керувати корпоративними даними.
Тривалість: залежить від вас
Мова: англійська
Ціна: залежить від обраного курсу
Рівень: початковий, середній, просунутий
5. Data Engineer (
Цей курс варто вибрати, якщо у вас є досвід роботи з Python і ви хочете поглибити свої знання та побудувати кар'єру спеціаліста з обробки даних. Ви навчитеся будувати конвеєри даних, використовуючи Python та pandas, завантажувати великі набори даних у БД Postgres після очищення, перетворення та перевірки.
Тривалість: залежить від вас
Мова: англійська
Ціна: залежить від форми передплати
Рівень: початковий, середній
6. Data Engineering with Google Cloud (
Цей курс допоможе вам придбати навички, необхідні для побудови кар'єри у сфері роботи з великими даними. Наприклад, робота з BigQuery, Spark. Ви отримаєте знання, які стануть у нагоді для підготовки до визнаної в галузі сертифікації Google Cloud Professional Data Engineer.
Тривалість: 4 місяці
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий, середній
7. Data Engineering, Big Data on Google Cloud Platform (
Цікавий курс, що дає практичні знання про системи обробки даних у GCP. Під час занять ви дізнаєтесь, як спроектувати системи, перш ніж розпочати процес розробки. Крім цього, ви також аналізуватимете як структуровані, так і неструктуровані дані, застосовувати автоматичне масштабування і застосовувати методи ML для отримання інформації.
Тривалість: 3 місяці
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий, середній
8. UC San Diego: Big Data Specialization (
Курс заснований на використанні інфраструктури Hadoop та Spark та застосуванні цих методів обробки великих даних у процесі ML. Ви ознайомитеся з основами використання Hadoop з MapReduce, Spark, Pig та Hive. Дізнаєтесь, як можна будувати прогнозні моделі та використовувати аналітику графів для моделювання проблем. Зазначимо, що для цього курсу не потрібний досвід програмування.
Тривалість: 8 місяців по 10 годин на тиждень
Мова: англійська
Ціна: поки що безкоштовно
Рівень: початковий
9. Taming Big Data With Apache Spark and Python (
Ви дізнаєтесь, як використовувати потокову структуру та кадри даних у Spark3, отримаєте уявлення про те, як використовувати сервіс Elastic MapReduce від Amazon для роботи з вашим кластером у Hadoop. Навчіться визначати проблеми при аналізі великих даних і зрозумієте, як бібліотеки GraphX працюють із мережним аналізом і як ви можете використовувати MLlib.
Тривалість: залежить від вас
Мова: англійська
Ціна: від 800 рублів до $149,99 (як пощастить)
Рівень: початковий, середній
10. PG Program in Big Data Engineering (
Цей курс дасть вам уявлення про те, як працює Aadhaar, як Facebook персоналізує стрічку новин та як взагалі можна використовувати Data Engineering. Ключовими темами стануть обробка даних (у тому числі обробка реального часу), MapReduce, аналітика великих даних.
Тривалість: 11 місяців
Мова: англійська
Ціна: в районі $3000
Рівень: початковий
11. Професія Data Scientist (
Ви навчитеся програмувати на Python, вивчіть фреймворки для навчання нейронних мереж Tensorflow та Keras. Освойте бази даних MongoDB, PostgreSQL, SQLite3, навчитеся працювати з бібліотеками Pandas, NumPy та Matpotlib.
Тривалість: 300 годин навчання
Мова: російська
Ціна: перші півроку безкоштовно, потім 3900 рублів на місяць
Рівень: початковий
12. Data Engineer 7.0 (
На вас чекає глибоке вивчення Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-архітектури та kappa-архітектури. Ви навчитеся підключати інструменти один до одного, формуючи пайплайни, отримуючи baseline-рішення. Для навчання потрібно мінімальне знання Python 3.
Тривалість: 21 заняття, 7 тижнів
Мова: російська
Ціна: від 60 000 до 120 000 рублів
Рівень: початковий
Якщо у вас є бажання додати ще один хороший курс, можете відписатися в коментарях або в ЛЗ. Ми доповнимо пост.
Що ще корисного можна почитати у блозі
→
→
→
→
→
Підписуйтесь на наш
Джерело: habr.com