Prema Statisti, do 2025. veličina tržišta velikih podataka će porasti na 175 zetabajta u poređenju sa 41 u 2019. (
Predgovor
Šta je inženjer podataka? Ovo je osoba koja je odgovorna za kreiranje i održavanje arhitekture podataka u projektu Data Science. Odgovornosti mogu uključivati osiguravanje nesmetanog protoka podataka između servera i aplikacije, integraciju novog softvera za upravljanje podacima, poboljšanje osnovnih procesa podataka i kreiranje vodova podataka.
Postoji ogroman broj tehnologija i alata koje inženjer podataka mora ovladati da bi radio sa računarstvom u oblaku, skladištima podataka, ETL (ekstrakcija, transformacija, učitavanje) itd. Štaviše, broj potrebnih vještina stalno raste, tako da inženjer podataka treba redovno da dopunjuje svoje znanje. Naša lista uključuje kurseve za početnike i iskusne profesionalce. Odaberite ono što vam odgovara.
1. Data Engineering Nanodegree Certification (
Naučićete kako da dizajnirate modele podataka, kreirate skladišta podataka i jezera podataka, automatizujete cevovode podataka i radite sa nizovima skupova podataka. Na kraju programa, testirat ćete svoje nove vještine dovršavanjem Capstone projekta.
Trajanje: 5 mjeseci, 5 sati sedmično
Jezik: engleski
Trošak: $ 1695
nivo: početni
2. Postanite certifikat Data Engineer (
Oni podučavaju od osnova. Možete napredovati korak po korak, koristeći predavanja i praktične projekte za rad na svojim vještinama. Do kraja obuke bićete spremni za rad sa ML i velikim podacima. Preporučljivo je poznavati Python barem na minimalnom nivou.
Trajanje: 8 mjeseci, 10 sati sedmično
Jezik: engleski
Trošak😕
nivo: početni
3. Postanite inženjer podataka: savladavanje koncepata (
Razvijat ćete inženjering podataka i DevOps vještine, naučiti kako kreirati Big Data aplikacije, kreirati kanale podataka, obraditi aplikacije u realnom vremenu koristeći Hazelcast i bazu podataka
Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: prvi mjesec - besplatno
nivo: početni
4. Kursevi inženjeringa podataka (
Evo niza programa koji vas uvode u inženjering podataka i uče vas kako da razvijete analitička rješenja. Kursevi su podijeljeni u kategorije na osnovu nivoa težine, tako da možete odabrati jedan prema svom nivou iskustva. Tokom obuke naučićete da koristite Spark, Hadoop, Azure i upravljate korporativnim podacima.
Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: zavisi od odabranog kursa
nivo: početni, srednji, napredni
5. Inženjer podataka (
Ovaj kurs vredi pohađati ako imate iskustva sa Pythonom i želite da produbite svoje znanje i izgradite karijeru kao naučnik podataka. Naučićete kako da napravite cevovode podataka koristeći Python i pande, učitavajući velike skupove podataka u Postgres bazu podataka nakon čišćenja, transformacije i validacije.
Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: zavisi od obrasca pretplate
nivo: početni, srednji
6. Inženjering podataka s Google Cloudom (
Ovaj kurs će vam pomoći da steknete vještine koje su vam potrebne za izgradnju karijere u velikim podacima. Na primjer, rad sa BigQuery, Spark. Steći ćete znanje koje vam je potrebno da se pripremite za industrijski priznati Google Cloud Professional Data Engineer certifikat.
Trajanje: 4 mjeseca
Jezik: engleski
Trošak: besplatno za sada
nivo: početni, srednji
7. Data Engineering, Big Data na Google Cloud Platformi (
Zanimljiv kurs koji pruža praktična znanja o sistemima obrade podataka u GCP-u. Tokom nastave ćete naučiti kako dizajnirati sisteme prije nego što započnete proces razvoja. Osim toga, također ćete analizirati i strukturirane i nestrukturirane podatke, primijeniti automatsko skaliranje i primijeniti ML tehnike za izdvajanje informacija.
Trajanje: 3 mjeseca
Jezik: engleski
Trošak: besplatno za sada
nivo: početni, srednji
8. UC San Diego: Specijalizacija za velike podatke (
Kurs se zasniva na korištenju Hadoop i Spark okvira i primjeni ovih tehnika velikih podataka u procesu ML-a. Naučit ćete osnove korištenja Hadoop-a uz MapReduce, Spark, Pig i Hive. Naučite kako izgraditi prediktivne modele i koristiti analitiku grafova za modeliranje problema. Imajte na umu da ovaj kurs ne zahtijeva nikakvo iskustvo u programiranju.
Trajanje: 8 mjeseci 10 sati sedmično
Jezik: engleski
Trošak: besplatno za sada
nivo: početni
9. Ukroćenje velikih podataka pomoću Apache Sparka i Pythona (
Naučit ćete kako koristiti strukturu toka i okvire podataka u Spark3 i steći razumijevanje o tome kako koristiti Amazonovu uslugu Elastic MapReduce za rad s vašim Hadoop klasterom. Naučite identificirati probleme u analizi velikih podataka i razumjeti kako GraphX biblioteke rade s analizom mreže i kako možete koristiti MLlib.
Trajanje: Zavisi od tebe
Jezik: engleski
Trošak: od 800 rubalja do 149,99 dolara (u zavisnosti od vaše sreće)
nivo: početni, srednji
10. PG program u Big Data Engineeringu (
Ovaj kurs će vam dati razumijevanje kako Aadhaar radi, kako Facebook personalizira feed vijesti i kako se općenito može koristiti Data Engineering. Ključne teme će biti obrada podataka (uključujući obradu u realnom vremenu), MapReduce, analitika velikih podataka.
Trajanje: 11 mjesec
Jezik: engleski
Trošak: oko 3000 dolara
nivo: početni
11. Profesija Data Scientist (
Naučit ćete programirati u Pythonu, proučiti okvire za obuku neuronskih mreža Tensorflow i Keras. Savladajte MongoDB, PostgreSQL, SQLite3 baze podataka, naučite da radite sa Pandas, NumPy i Matpotlib bibliotekama.
Trajanje: 300 sati obuke
Jezik: ruski
Trošak: prvih šest mjeseci besplatno, zatim 3900 rubalja mjesečno
nivo: početni
12. Data Engineer 7.0 (
Dobićete detaljnu studiju Kafke, HDFS, ClickHouse, Spark, Airflow, lambda arhitekture i kappa arhitekture. Naučićete kako da povežete alate jedan sa drugim, formirate cevovode, dobijete osnovno rešenje. Za učenje je potrebno minimalno poznavanje Pythona 3.
Trajanje: 21 lekcija, 7 sedmica
Jezik: ruski
Trošak: od 60 do 000 rubalja
nivo: početni
Ako želite dodati još jedan dobar kurs na listu, možete se odjaviti u komentarima ili u PM-u. Mi ćemo ažurirati objavu.
Šta još možete pročitati na blogu?
→
→
→
→
→
Pretplatite se na naše
izvor: www.habr.com