12 онлајн курсеви за инженерство на податоци

12 онлајн курсеви за инженерство на податоци
Според Statista, до 2025 година големината на пазарот на големи податоци ќе порасне на 175 зетабајти во споредба со 41 во 2019 година (Распоред). За да добиете работа во оваа област, треба да разберете како да работите со големи податоци складирани во облакот. Cloud4Y состави листа од 12 платени и бесплатни курсеви за инженерство на податоци кои ќе го прошират вашето знаење од областа и можат да бидат добра почетна точка на вашиот пат до сертификати за облак.

предговорот

Што е инженер за податоци? Ова е лицето кое е одговорно за креирање и одржување на архитектурата на податоци во проект на Data Science. Одговорностите може да вклучуваат обезбедување непречен проток на податоци помеѓу серверот и апликацијата, интегрирање на нов софтвер за управување со податоци, подобрување на основните процеси на податоци и создавање на цевководи за податоци.

Има огромен број на технологии и алатки кои инженерот за податоци мора да ги совлада за да работи со cloud computing, складишта за податоци, ETL (вадење, трансформација, вчитување), итн. Покрај тоа, бројот на потребните вештини постојано расте. така што инженерот за податоци треба редовно да го надополнува своето знаење. Нашата листа вклучува курсеви за почетници и искусни професионалци. Изберете што ви одговара.

1. Сертификација за наностепен за инженерство на податоци (Udacity)

Ќе научите како да дизајнирате модели на податоци, да креирате складишта за податоци и езера на податоци, да ги автоматизирате цевководите за податоци и да работите со низи од збирки на податоци. На крајот од програмата, ќе ги тестирате вашите нови вештини со завршување на проект Capstone.

Времетраење: 5 месеци, 5 часа неделно
Јазик: Англиски
Цена: $ 1695
Ниво: почетна

2. Станете сертификат за инженер за податоци (Coursera)

Учат од основите. Можете да напредувате чекор по чекор, користејќи предавања и практични проекти за да работите на вашите вештини. До крајот на обуката, ќе бидете подготвени да работите со ML и големи податоци. Се препорачува да се знае Python барем на минимално ниво.

Времетраење: 8 месеци, 10 часа неделно
Јазик: Англиски
Цена😕
Ниво: почетна

3. Станете инженер за податоци: совладување на концептите (LinkedIn Learning)

Ќе развиете вештини за инженерство на податоци и DevOps, ќе научите како да креирате апликации за големи податоци, ќе креирате цевки за податоци, ќе обработувате апликации во реално време користејќи Hazelcast и база на податоци Hadoop.

Времетраење: Зависи од тебе
Јазик: Англиски
Цена: првиот месец - бесплатно
Ниво: почетна

4. Курсеви за инженерство на податоци (Edx)

Еве серија програми кои ве запознаваат со инженерството на податоци и ве учат како да развивате аналитички решенија. Курсевите се поделени во категории врз основа на нивото на тежина, така што можете да изберете еден според нивото на вашето искуство. За време на обуката ќе научите да користите Spark, Hadoop, Azure и да управувате со корпоративни податоци.

Времетраење: Зависи од тебе
Јазик: Англиски
Цена: зависи од избраниот курс
Ниво: почетник, средно, напреден

5. Инженер за податоци (DataQuest)

Овој курс вреди да се земе доколку имате искуство со Python и сакате да го продлабочите своето знаење и да изградите кариера како научник за податоци. Ќе научите како да изградите цевководи за податоци користејќи Python и панди, вчитувајќи големи збирки податоци во базата на податоци на Postgres по чистење, трансформирање и потврдување.

Времетраење: Зависи од тебе
Јазик: Англиски
Цена: зависи од формуларот за претплата
Ниво: почетник, средно

6. Инженеринг на податоци со Google Cloud (Coursera)

Овој курс ќе ви помогне да ги стекнете вештините што ви се потребни за да изградите кариера во големите податоци. На пример, работа со BigQuery, Spark. Ќе го стекнете знаењето што ви е потребно за да се подготвите за сертификатот за професионален инженер за податоци на Google Cloud, признат во индустријата.

Времетраење: 4 месеци
Јазик: Англиски
Цена: бесплатно засега
Ниво: почетник, средно

7. Инженеринг на податоци, големи податоци на Google Cloud Platform (Coursera)

Интересен курс кој обезбедува практично знаење за системите за обработка на податоци во GCP. За време на часот, ќе научите како да дизајнирате системи пред да започнете со процесот на развој. Дополнително, ќе ги анализирате и структурираните и неструктурираните податоци, ќе примените автоматско скалирање и ќе примените ML техники за извлекување информации.

Времетраење: 3 месеци
Јазик: Англиски
Цена: бесплатно засега
Ниво: почетник, средно

8. UC San Diego: Big Data Specialization (Coursera)

Курсот се заснова на користење на рамката Hadoop и Spark и примена на овие техники за големи податоци во процесот на ML. Ќе ги научите основите за користење на Hadoop со MapReduce, Spark, Pig и Hive. Научете како да изградите предвидливи модели и да користите аналитика на графикони за да моделирате проблеми. Ве молиме имајте предвид дека овој курс не бара никакво програмско искуство.

Времетраење: 8 месеци 10 часа неделно
Јазик: Англиски
Цена: бесплатно засега
Ниво: почетна

9. Припитомување големи податоци со Apache Spark и Python (Udemy)

Ќе научите како да ја користите структурата на преносот и податочните рамки во Spark3 и ќе стекнете разбирање за тоа како да ја користите услугата Elastic MapReduce на Amazon за да работите со вашиот Hadoop кластер. Научете да идентификувате проблеми во анализата на големи податоци и разберете како библиотеките GraphX ​​работат со мрежна анализа и како можете да користите MLlib.

Времетраење: Зависи од тебе
Јазик: Англиски
Цена: од 800 рубли до 149,99 долари (во зависност од вашата среќа)
Ниво: почетник, средно

10. PG програма во инженерство на големи податоци (нагореГрад)

Овој курс ќе ви даде разбирање за тоа како функционира Aadhaar, како Facebook го персонализира вестите и како воопшто може да се користи Data Engineering. Клучни теми ќе бидат обработка на податоци (вклучувајќи и обработка во реално време), MapReduce, аналитика на големи податоци.

Времетраење: 11 месеци
Јазик: Англиски
Цена: околу 3000 долари
Ниво: почетна

11. Професионален научник за податоци (Кутија за вештини)

Ќе научите да програмирате во Python, да ги проучувате рамки за обука на невронски мрежи Tensorflow и Keras. Совладете ги базите на податоци MongoDB, PostgreSQL, SQLite3, научете да работите со библиотеките Pandas, NumPy и Matpotlib.

Времетраење: 300 часа обука
Јазик: Руски
Цена: првите шест месеци бесплатно, потоа 3900 рубли месечно
Ниво: почетна

12. Инженер за податоци 7.0 (Лабораторија за нови професии)

Ќе добиете длабинска студија за Кафка, HDFS, ClickHouse, Spark, Airflow, архитектурата ламбда и архитектурата капа. Ќе научите како да ги поврзувате алатките едни со други, формирајќи цевководи, добивајќи основно решение. За учење, потребно е минимално познавање на Python 3.

Времетраење: 21 лекција, 7 недели
Јазик: Руски
Цена: од 60 до 000 рубли
Ниво: почетна

Ако сакате да додадете уште еден добар курс на листата, можете да се откажете во коментари или во PM. Ќе ја ажурираме објавата.

Што друго можете да прочитате на блогот? Cloud4y

Која е геометријата на универзумот?
Велигденски јајца на топографски карти на Швајцарија
Поедноставена и многу кратка историја на развојот на „облаците“
Како пропадна банката?
Компјутерски брендови од 90-тите, дел 3, финале

Претплатете се на нашата Телеграма-канал за да не ја пропуштите следната статија. Ние пишуваме не повеќе од двапати неделно и само на деловен план. Потсетуваме и дека на 21 мај во 15:00 часот (московско време) ќе одржиме webinar на тема „Безбедност на деловните информации при работа на далечина“. Ако сакате да разберете како да ги заштитите чувствителните и корпоративните информации кога вработените работат од дома, регистрирајте се!

Извор: www.habr.com

Додадете коментар