12 Online kurseva za inženjering podataka

12 Online kurseva za inženjering podataka
Prema Statisti, do 2025. veličina tržišta velikih podataka će porasti na 175 zetabajta u poređenju sa 41 u 2019. (raspored). Da biste dobili posao u ovoj oblasti, morate razumjeti kako raditi s velikim podacima pohranjenim u oblaku. Cloud4Y je sastavio listu od 12 plaćenih i besplatnih kurseva za inženjering podataka koji će proširiti vaše znanje u ovoj oblasti i mogu biti dobra polazna tačka na vašem putu ka certifikaciji u oblaku.

Predgovor

Šta je inženjer podataka? Ovo je osoba koja je odgovorna za kreiranje i održavanje arhitekture podataka u projektu Data Science. Odgovornosti mogu uključivati ​​osiguravanje nesmetanog protoka podataka između servera i aplikacije, integraciju novog softvera za upravljanje podacima, poboljšanje osnovnih procesa podataka i kreiranje vodova podataka.

Postoji ogroman broj tehnologija i alata koje inženjer podataka mora ovladati da bi radio sa računarstvom u oblaku, skladištima podataka, ETL (ekstrakcija, transformacija, učitavanje) itd. Štaviše, broj potrebnih vještina stalno raste, tako da inženjer podataka treba redovno da dopunjuje svoje znanje. Naša lista uključuje kurseve za početnike i iskusne profesionalce. Odaberite ono što vam odgovara.

1. Data Engineering Nanodegree Certification (Udacity)

Naučićete kako da dizajnirate modele podataka, kreirate skladišta podataka i jezera podataka, automatizujete cevovode podataka i radite sa nizovima skupova podataka. Na kraju programa, testirat ćete svoje nove vještine dovršavanjem Capstone projekta.

Trajanje: 5 mjeseci, 5 sati sedmično
Jezik: engleski
Trošak: $ 1695
nivo: početni

2. Postanite certifikat Data Engineer (Coursera)

Oni podučavaju od osnova. Možete napredovati korak po korak, koristeći predavanja i praktične projekte za rad na svojim vještinama. Do kraja obuke bićete spremni za rad sa ML i velikim podacima. Preporučljivo je poznavati Python barem na minimalnom nivou.

Trajanje: 8 mjeseci, 10 sati sedmično
Jezik: engleski
Trošak😕
nivo: početni

3. Postanite inženjer podataka: savladavanje koncepata (LinkedIn Learning)

Razvijat ćete inženjering podataka i DevOps vještine, naučiti kako kreirati Big Data aplikacije, kreirati kanale podataka, obraditi aplikacije u realnom vremenu koristeći Hazelcast i bazu podataka Hadoop.

Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: prvi mjesec - besplatno
nivo: početni

4. Kursevi inženjeringa podataka (edX)

Evo niza programa koji vas uvode u inženjering podataka i uče vas kako da razvijete analitička rješenja. Kursevi su podijeljeni u kategorije na osnovu nivoa težine, tako da možete odabrati jedan prema svom nivou iskustva. Tokom obuke naučićete da koristite Spark, Hadoop, Azure i upravljate korporativnim podacima.

Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: zavisi od odabranog kursa
nivo: početni, srednji, napredni

5. Inženjer podataka (DataQuest)

Ovaj kurs vredi pohađati ako imate iskustva sa Pythonom i želite da produbite svoje znanje i izgradite karijeru kao naučnik podataka. Naučićete kako da napravite cevovode podataka koristeći Python i pande, učitavajući velike skupove podataka u Postgres bazu podataka nakon čišćenja, transformacije i validacije.

Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: zavisi od obrasca pretplate
nivo: početni, srednji

6. Inženjering podataka s Google Cloudom (Coursera)

Ovaj kurs će vam pomoći da steknete vještine koje su vam potrebne za izgradnju karijere u velikim podacima. Na primjer, rad sa BigQuery, Spark. Steći ćete znanje koje vam je potrebno da se pripremite za industrijski priznati Google Cloud Professional Data Engineer certifikat.

Trajanje: 4 mjeseca
Jezik: engleski
Trošak: besplatno za sada
nivo: početni, srednji

7. Data Engineering, Big Data na Google Cloud Platformi (Coursera)

Zanimljiv kurs koji pruža praktična znanja o sistemima obrade podataka u GCP-u. Tokom nastave ćete naučiti kako dizajnirati sisteme prije nego što započnete proces razvoja. Osim toga, također ćete analizirati i strukturirane i nestrukturirane podatke, primijeniti automatsko skaliranje i primijeniti ML tehnike za izdvajanje informacija.

Trajanje: 3 mjeseca
Jezik: engleski
Trošak: besplatno za sada
nivo: početni, srednji

8. UC San Diego: Specijalizacija za velike podatke (Coursera)

Kurs se zasniva na korištenju Hadoop i Spark okvira i primjeni ovih tehnika velikih podataka u procesu ML-a. Naučit ćete osnove korištenja Hadoop-a uz MapReduce, Spark, Pig i Hive. Naučite kako izgraditi prediktivne modele i koristiti analitiku grafova za modeliranje problema. Imajte na umu da ovaj kurs ne zahtijeva nikakvo iskustvo u programiranju.

Trajanje: 8 mjeseci 10 sati sedmično
Jezik: engleski
Trošak: besplatno za sada
nivo: početni

9. Ukroćenje velikih podataka pomoću Apache Sparka i Pythona (Udemy)

Naučit ćete kako koristiti strukturu toka i okvire podataka u Spark3 i steći razumijevanje o tome kako koristiti Amazonovu uslugu Elastic MapReduce za rad s vašim Hadoop klasterom. Naučite identificirati probleme u analizi velikih podataka i razumjeti kako GraphX ​​biblioteke rade s analizom mreže i kako možete koristiti MLlib.

Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: od 800 rubalja do 149,99 dolara (u zavisnosti od vaše sreće)
nivo: početni, srednji

10. PG program u Big Data Engineeringu (upGrad)

Ovaj kurs će vam dati razumijevanje kako Aadhaar radi, kako Facebook personalizira feed vijesti i kako se općenito može koristiti Data Engineering. Ključne teme će biti obrada podataka (uključujući obradu u realnom vremenu), MapReduce, analitika velikih podataka.

Trajanje: 11 mjesec
Jezik: engleski
Trošak: oko 3000 dolara
nivo: početni

11. Profesija Data Scientist (Kutija za vještine)

Naučit ćete programirati u Pythonu, proučiti okvire za obuku neuronskih mreža Tensorflow i Keras. Savladajte MongoDB, PostgreSQL, SQLite3 baze podataka, naučite da radite sa Pandas, NumPy i Matpotlib bibliotekama.

Trajanje: 300 sati obuke
Jezik: ruski
Trošak: prvih šest mjeseci besplatno, zatim 3900 rubalja mjesečno
nivo: početni

12. Data Engineer 7.0 (Laboratorija za nove profesije)

Dobićete detaljnu studiju Kafke, HDFS, ClickHouse, Spark, Airflow, lambda arhitekture i kappa arhitekture. Naučićete kako da povežete alate jedan sa drugim, formirate cevovode, dobijete osnovno rešenje. Za učenje je potrebno minimalno poznavanje Pythona 3.

Trajanje: 21 lekcija, 7 sedmica
Jezik: ruski
Trošak: od 60 do 000 rubalja
nivo: početni

Ako želite dodati još jedan dobar kurs na listu, možete se odjaviti u komentarima ili u PM-u. Mi ćemo ažurirati objavu.

Šta još možete pročitati na blogu? Cloud4Y

Šta je geometrija Univerzuma?
Uskršnja jaja na topografskim kartama Švicarske
Pojednostavljena i vrlo kratka istorija razvoja "oblaka"
Kako je banka propala?
Brendovi kompjutera 90-ih, dio 3, final

Pretplatite se na naše telegram-kanal da ne propustite sledeći članak. Pišemo ne više od dva puta sedmično i samo poslovno. Takođe vas podsećamo da ćemo 21. maja u 15:00 (po moskovskom vremenu) održati webinar na temu “Sigurnost poslovnih informacija pri radu na daljinu.” Ako želite razumjeti kako zaštititi osjetljive i korporativne informacije kada zaposleni rade od kuće, registrirajte se!

izvor: www.habr.com

Dodajte komentar