Ifølge Statista vil størrelsen af big data-markedet i 2025 vokse til 175 zettabyte sammenlignet med 41 i 2019 (
Forord
Hvad er en dataingeniør? Dette er den person, der er ansvarlig for at skabe og vedligeholde dataarkitekturen i et Data Science projekt. Ansvar kan omfatte at sikre glat dataflow mellem serveren og applikationen, integrere ny datastyringssoftware, forbedre underliggende dataprocesser og skabe datapipelines.
Der er et stort antal teknologier og værktøjer, som en dataingeniør skal mestre for at kunne arbejde med cloud computing, datavarehuse, ETL (ekstraktion, transformation, loading) osv. Desuden vokser antallet af nødvendige færdigheder hele tiden, så en dataingeniør skal regelmæssigt genopbygge sin viden. Vores liste omfatter kurser for begyndere og erfarne professionelle. Vælg, hvad der passer dig.
1. Data Engineering Nanodegree certificering (
Du vil lære at designe datamodeller, skabe datavarehuse og datasøer, automatisere datapipelines og arbejde med arrays af datasæt. I slutningen af programmet vil du teste dine nye færdigheder ved at gennemføre et Capstone-projekt.
Varighed: 5 måneder, 5 timer om ugen
Sprog: Engelsk
Pris: $ 1695
Level: initial
2. Bliv dataingeniør-certificering (
De underviser fra det grundlæggende. Du kan gøre fremskridt trin for trin ved at bruge forelæsninger og praktiske projekter til at arbejde på dine færdigheder. Ved afslutningen af uddannelsen vil du være klar til at arbejde med ML og big data. Det anbefales at kende Python i det mindste på et minimumsniveau.
Varighed: 8 måneder, 10 timer om ugen
Sprog: Engelsk
Pris😕
Level: initial
3. Bliv dataingeniør: Mestring af koncepterne (
Du vil udvikle data engineering og DevOps færdigheder, lære at skabe Big Data applikationer, skabe data pipelines, behandle applikationer i realtid ved hjælp af Hazelcast og en database
Varighed: Afhænger af dig
Sprog: Engelsk
Pris: første måned - gratis
Level: initial
4. Dataingeniørkurser (
Her er en række programmer, der introducerer dig til datateknik og lærer dig, hvordan du udvikler analytiske løsninger. Kurser er opdelt i kategorier baseret på sværhedsgrad, så du kan vælge et efter dit erfaringsniveau. I løbet af uddannelsen lærer du at bruge Spark, Hadoop, Azure og administrere virksomhedsdata.
Varighed: Afhænger af dig
Sprog: Engelsk
Pris: afhænger af det valgte kursus
Level: begynder, mellem, avanceret
5. Dataingeniør (
Dette kursus er værd at tage, hvis du har erfaring med Python og ønsker at uddybe din viden og opbygge en karriere som data scientist. Du lærer, hvordan du bygger datapipelines ved hjælp af Python og pandaer, hvor du indlæser store datasæt i en Postgres-database efter rensning, transformation og validering.
Varighed: Afhænger af dig
Sprog: Engelsk
Pris: afhænger af tilmeldingsformularen
Level: begynder, mellemliggende
6. Datateknik med Google Cloud (
Dette kursus hjælper dig med at få de færdigheder, du har brug for til at opbygge en karriere inden for big data. For eksempel arbejde med BigQuery, Spark. Du får den viden, du skal bruge for at forberede dig til den brancheanerkendte Google Cloud Professional Data Engineer-certificering.
Varighed: 4 måneder
Sprog: Engelsk
Pris: gratis lige nu
Level: begynder, mellemliggende
7. Data Engineering, Big Data på Google Cloud Platform (
Et interessant kursus, der giver praktisk viden om databehandlingssystemer i GCP. I løbet af timen lærer du at designe systemer, inden du starter udviklingsprocessen. Derudover vil du også analysere både strukturerede og ustrukturerede data, anvende auto-skalering og anvende ML-teknikker til at udtrække information.
Varighed: 3 måneder
Sprog: Engelsk
Pris: gratis lige nu
Level: begynder, mellemliggende
8. UC San Diego: Big Data Specialization (
Kurset er baseret på at bruge Hadoop- og Spark-rammerne og anvende disse big data-teknikker til ML-processen. Du lærer det grundlæggende i at bruge Hadoop med MapReduce, Spark, Pig og Hive. Lær, hvordan du bygger forudsigende modeller og bruger grafanalyse til at modellere problemer. Bemærk venligst, at dette kursus ikke kræver nogen programmeringserfaring.
Varighed: 8 måneder 10 timer om ugen
Sprog: Engelsk
Pris: gratis lige nu
Level: initial
9. Tæmme Big Data med Apache Spark og Python (
Du lærer, hvordan du bruger strømstrukturen og datarammer i Spark3, og får en forståelse af, hvordan du bruger Amazons Elastic MapReduce-tjeneste til at arbejde med din Hadoop-klynge. Lær at identificere problemer i big data-analyse og forstå, hvordan GraphX-biblioteker arbejder med netværksanalyse, og hvordan du kan bruge MLlib.
Varighed: Afhænger af dig
Sprog: Engelsk
Pris: fra 800 rubler til $149,99 (afhængigt af dit held)
Level: begynder, mellemliggende
10. PG-program i Big Data Engineering (
Dette kursus vil give dig en idé om, hvordan Aadhaar fungerer, hvordan Facebook personaliserer nyhedsfeedet, og hvordan Data Engineering kan bruges generelt. Nøgleemner vil være databehandling (herunder realtidsbehandling), MapReduce, big data-analyse.
Varighed: 11 måned
Sprog: Engelsk
Pris: omkring $3000
Level: initial
11. Profession Data Scientist (
Du lærer at programmere i Python, studere rammerne for træning af neurale netværk Tensorflow og Keras. Mestre MongoDB, PostgreSQL, SQLite3 databaserne, lær at arbejde med Pandas, NumPy og Matpotlib bibliotekerne.
Varighed: 300 timers træning
Sprog: Russisk
Pris: første seks måneder gratis, derefter 3900 rubler om måneden
Level: initial
12. Data Engineer 7.0 (
Du vil modtage en dybdegående undersøgelse af Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-arkitektur og kappa-arkitektur. Du lærer, hvordan du forbinder værktøjer til hinanden, danner rørledninger og opnår en basisløsning. For at studere kræves et minimumskendskab til Python 3.
Varighed: 21 lektioner, 7 uger
Sprog: Russisk
Pris: fra 60 til 000 rubler
Level: initial
Hvis du vil tilføje endnu et godt kursus til listen, kan du afmelde dig i kommentarerne eller i en PM. Vi opdaterer opslaget.
Hvad kan du ellers læse på bloggen?
→
→
→
→
→
Abonner på vores
Kilde: www.habr.com