12 spletnih tečajev podatkovnega inženiringa

12 spletnih tečajev podatkovnega inženiringa
Po podatkih Statiste bo do leta 2025 velikost trga velikih podatkov narasla na 175 zetabajtov v primerjavi z 41 leta 2019 (urnik). Če želite dobiti službo na tem področju, morate razumeti, kako delati z velikimi podatki, shranjenimi v oblaku. Cloud4Y je sestavil seznam 12 plačljivih in brezplačnih tečajev podatkovnega inženiringa, ki bodo razširili vaše znanje na tem področju in so lahko dobro izhodišče na vaši poti do certificiranja v oblaku.

Predgovor

Kaj je podatkovni inženir? To je oseba, ki je odgovorna za ustvarjanje in vzdrževanje podatkovne arhitekture v projektu Data Science. Odgovornosti lahko vključujejo zagotavljanje nemotenega pretoka podatkov med strežnikom in aplikacijo, integracijo nove programske opreme za upravljanje podatkov, izboljšanje osnovnih podatkovnih procesov in ustvarjanje podatkovnih cevovodov.

Obstaja ogromno tehnologij in orodij, ki jih mora obvladati podatkovni inženir, da lahko dela z računalništvom v oblaku, podatkovnimi skladišči, ETL (extraction, transformation, loading) itd. Poleg tega število potrebnih veščin ves čas narašča, zato mora podatkovni inženir redno dopolnjevati svoje znanje. Naš seznam vključuje tečaje za začetnike in izkušene strokovnjake. Izberite tisto, kar vam ustreza.

1. Certificiranje nanostopenj podatkovnega inženiringa (Udacity)

Naučili se boste oblikovati podatkovne modele, ustvariti podatkovna skladišča in podatkovna jezera, avtomatizirati podatkovne kanale in delati z nizi naborov podatkov. Na koncu programa boste preizkusili svoje nove veščine z dokončanjem projekta Capstone.

Trajanje: 5 mesecev, 5 ur na teden
Jezik: Angleščina
Cena: $ 1695
Raven: začetnica

2. Postanite certifikat podatkovnega inženirja (Coursera)

Učijo iz osnov. Napredujete lahko korak za korakom z uporabo predavanj in praktičnih projektov za razvijanje svojih veščin. Ob koncu usposabljanja boste pripravljeni na delo z ML in velikimi podatki. Python je priporočljivo poznati vsaj na minimalni ravni.

Trajanje: 8 mesecev, 10 ur na teden
Jezik: Angleščina
Cena😕
Raven: začetnica

3. Postanite podatkovni inženir: obvladovanje konceptov (Povezovanje učenja)

Razvili boste veščine podatkovnega inženiringa in DevOps, se naučili ustvarjati aplikacije za velike podatke, ustvarjati podatkovne kanale, obdelovati aplikacije v realnem času z uporabo Hazelcasta in baze podatkov. Hadoop.

Trajanje: Odvisno od tebe
Jezik: Angleščina
Cena: prvi mesec - brezplačno
Raven: začetnica

4. Tečaji podatkovnega inženiringa (EDX)

Tukaj je serija programov, ki vas seznanijo s podatkovnim inženiringom in vas naučijo razvijati analitične rešitve. Tečaji so razdeljeni v kategorije glede na težavnostno stopnjo, tako da lahko izberete enega glede na svojo raven izkušenj. Na izobraževanju se boste naučili uporabljati Spark, Hadoop, Azure in upravljati s korporativnimi podatki.

Trajanje: Odvisno od tebe
Jezik: Angleščina
Cena: odvisno od izbranega tečaja
Raven: začetni, srednji, napredni

5. Podatkovni inženir (DataQuest)

Ta tečaj je vreden obiska, če imate izkušnje s Pythonom in želite poglobiti svoje znanje ter zgraditi kariero podatkovnega znanstvenika. Naučili se boste, kako zgraditi podatkovne cevovode z uporabo Pythona in pand, naložiti velike nize podatkov v bazo podatkov Postgres po čiščenju, preoblikovanju in preverjanju.

Trajanje: Odvisno od tebe
Jezik: Angleščina
Cena: odvisno od naročnine
Raven: začetni, srednji

6. Podatkovni inženiring z Google Cloud (Coursera)

Ta tečaj vam bo pomagal pridobiti veščine, ki jih potrebujete za gradnjo kariere na področju velikih podatkov. Na primer delo z BigQuery, Spark. Pridobili boste znanje, ki ga potrebujete za pripravo na industrijsko priznano certifikacijo Google Cloud Professional Data Engineer.

Trajanje: 4 mesece
Jezik: Angleščina
Cena: zaenkrat brezplačno
Raven: začetni, srednji

7. Podatkovni inženiring, veliki podatki na platformi Google Cloud (Coursera)

Zanimiv tečaj, ki nudi praktično znanje o sistemih za obdelavo podatkov v GCP. Med predavanjem se boste naučili načrtovati sisteme pred začetkom razvojnega procesa. Poleg tega boste analizirali tako strukturirane kot nestrukturirane podatke, uporabili samodejno skaliranje in uporabili tehnike ML za pridobivanje informacij.

Trajanje: 3 mesece
Jezik: Angleščina
Cena: zaenkrat brezplačno
Raven: začetni, srednji

8. UC San Diego: specializacija za velike podatke (Coursera)

Tečaj temelji na uporabi ogrodja Hadoop in Spark ter uporabi teh tehnik velikih podatkov v procesu strojnega učenja. Naučili se boste osnov uporabe Hadoopa z MapReduce, Spark, Pig in Hive. Naučite se zgraditi napovedne modele in uporabiti analitiko grafov za modeliranje težav. Upoštevajte, da ta tečaj ne zahteva izkušenj s programiranjem.

Trajanje: 8 mesecev 10 ur na teden
Jezik: Angleščina
Cena: zaenkrat brezplačno
Raven: začetnica

9. Krotenje velikih podatkov z Apache Spark in Python (Udemy)

Naučili se boste, kako uporabljati strukturo toka in podatkovne okvire v Spark3, ter razumeli, kako uporabljati Amazonovo storitev Elastic MapReduce za delo z vašo gručo Hadoop. Naučite se prepoznati težave pri analizi velikih podatkov in razumeti, kako knjižnice GraphX ​​delujejo z analizo omrežja in kako lahko uporabljate MLlib.

Trajanje: Odvisno od tebe
Jezik: Angleščina
Cena: od 800 rubljev do 149,99 $ (odvisno od vaše sreče)
Raven: začetni, srednji

10. Program PG v inženirstvu velikih podatkov (upGrad)

Ta tečaj vam bo dal razumevanje o tem, kako deluje Aadhaar, kako Facebook prilagodi vir novic in kako se na splošno lahko uporablja Data Engineering. Ključne teme bodo obdelava podatkov (vključno z obdelavo v realnem času), MapReduce, analitika velikih podatkov.

Trajanje: 11 mesec
Jezik: Angleščina
Cena: okoli 3000 $
Raven: začetnica

11. Poklic Data Scientist (Škatla za spretnosti)

Naučili se boste programirati v Pythonu, preučili ogrodja za usposabljanje nevronskih mrež Tensorflow in Keras. Obvladajte baze podatkov MongoDB, PostgreSQL, SQLite3, naučite se delati s knjižnicami Pandas, NumPy in Matpotlib.

Trajanje: 300 ur usposabljanja
Jezik: ruski
Cena: prvih šest mesecev brezplačno, nato 3900 rubljev na mesec
Raven: začetnica

12. Podatkovni inženir 7.0 (Laboratorij za nove poklice)

Prejeli boste poglobljeno študijo Kafke, HDFS, ClickHouse, Spark, Airflow, lambda arhitekture in kappa arhitekture. Naučili se boste povezovanja orodij med seboj, oblikovanja cevovodov, pridobivanja osnovne rešitve. Za študij je potrebno minimalno znanje Pythona 3.

Trajanje: 21 lekcij, 7 tednov
Jezik: ruski
Cena: od 60 do 000 rubljev
Raven: začetnica

Če želite na seznam dodati še kakšen dober tečaj, se lahko odjavite v komentarjih ali v ZS. Objavo bomo posodobili.

Kaj še lahko preberete na blogu? Cloud4Y

Kakšna je geometrija vesolja?
Velikonočna jajca na topografskih zemljevidih ​​Švice
Poenostavljena in zelo kratka zgodovina razvoja "oblakov"
Kako je propadla banka?
Računalniške znamke 90-ih, 3. del, končni

Naročite se na našo Telegram-kanal, da ne zamudite naslednjega članka. Pišemo največ dvakrat na teden in samo poslovno. Spomnimo vas tudi, da bomo 21. maja ob 15 (po moskovskem času). webinar na temo “Varnost poslovnih informacij pri delu na daljavo.” Če želite razumeti, kako zaščititi občutljive in korporativne podatke, ko zaposleni delajo od doma, se registrirajte!

Vir: www.habr.com

Dodaj komentar