Com vaig aprovar l'examen de certificació d'enginyer de dades professional de Google Cloud

Sense els 3 anys d'experiència pràctica recomanats

Abans de l'inici del curs Enginyer de dades, volem compartir amb vosaltres la traducció d'una història molt interessant, que sens dubte serà útil per als futurs enginyers de dades. Va!

Com vaig aprovar l'examen de certificació d'enginyer de dades professional de Google Cloud
Dessuadora amb caputxa de Google: posa't. Expressió facial de treball seriosa: present. Foto de la versió en vídeo d'aquest article a YouTube.

Nota. Aquest article tracta l'examen de certificació de Google Cloud Professional Data Engineer fins al 29 de març de 2019. Hi ha hagut alguns canvis des d'aquesta data. Els he inclòs a la secció d'Extres.

Aleshores, vols aconseguir una nova dessuadora amb caputxa com a la meva portada? O estàs pensant a certificar-te? Enginyer de dades professional de Google Cloud i preguntant-se com fer-ho.

Durant els darrers mesos, he fet cursos juntament amb l'ús de Google Cloud per preparar-me per a l'examen d'Enginyer de dades professional. Llavors vaig intentar passar-ho i vaig passar. I unes setmanes més tard em van lliurar la dessuadora. El certificat va arribar ràpidament.

En aquest article s'enumeren algunes coses que potser voldreu saber i els passos que vaig seguir per obtenir la meva certificació d'Enginyer de dades professional de Google Cloud.

Per què t'agradaria obtenir la certificació com a enginyer de dades professional de Google Cloud?

Les dades estan a tot arreu. I és necessari saber com construir sistemes que puguin processar i utilitzar dades. Google Cloud proporciona la infraestructura per construir aquests sistemes.

És possible que ja tingueu les habilitats per utilitzar Google Cloud, però com ho demostrareu a un futur empresari o client? Hi ha dues vies: cartera de projectes o certificació.

El certificat diu als futurs clients i empresaris: "Tinc les habilitats i he fet l'esforç d'acreditar-me".

Una breu descripció de Google ho resumeix.

Demostra la teva capacitat per dissenyar i crear sistemes de dades i crear models d'aprenentatge automàtic a Google Cloud Platform.

Si encara no teniu les habilitats, seguir els tutorials de certificació vol dir que aprendreu tot sobre com crear sistemes de dades de classe mundial a Google Cloud.

A qui li agradaria obtenir la certificació com a enginyer de dades professional de Google Cloud?

Has vist els números. El núvol està creixent. Ja és aquí i no va enlloc. Si encara no heu vist els números, confieu en mi, el núvol està creixent.

Tant si ja sou un científic de dades, un enginyer de dades, un analista de dades, un enginyer d'aprenentatge automàtic o busqueu una oportunitat de carrera al món de les dades, la certificació d'enginyer de dades professional de Google Cloud és per a vosaltres.

La capacitat d'utilitzar el núvol s'està convertint en un requisit per a qualsevol posició centrada en dades.

Necessites una certificació per ser un bon enginyer de dades/científic de dades/enginyer d'aprenentatge automàtic?

No

Encara podeu utilitzar Google Cloud per a solucions de transferència de dades sense un certificat.

Un certificat és només un dels mètodes per validar les habilitats existents.

Quant costa?

El cost de l'examen és de 200 dòlars. Si fracassa, hauràs de tornar a pagar per un nou intent.

Pot haver-hi costos associats als cursos preparatoris i l'ús de la pròpia plataforma.

Els càrrecs de la plataforma són càrrecs per utilitzar els serveis de Google Cloud. Si ets un usuari sofisticat, ja ho saps. Si no, i tot just esteu començant amb els tutorials d'aquest article, podeu crear un compte de Google Cloud nou i mantenir-vos dins dels 300 dòlars que ofereix Google en registrar-vos.

Aconseguirem el cost del curs en un segon.

Quant de temps té validesa la certificació?

2 anys. Després d'això, haureu de tornar a fer l'examen.

I com que Google Cloud evoluciona cada dia, és probable que canviï el que es requereix per a un certificat (com vaig saber, ja havia canviat quan vaig començar a escriure aquest article).

Què necessites per preparar l'examen?

Google recomana més de 3 anys d'experiència en el sector i més d'1 any de desenvolupament i gestió de solucions amb GCP per a la certificació de nivell professional.

No tenia cap de les anteriors.

A partir de 6 mesos d'experiència rellevant. Per compensar el dèficit, vaig utilitzar una combinació de recursos d'aprenentatge en línia.

Quins cursos vaig fer?

Si ets com jo i no tens els requisits recomanats, pots fer alguns dels cursos següents per millorar les teves habilitats.

Els cursos següents són els que vaig utilitzar per preparar la certificació. S'enumeren per ordre d'acabament.

He enumerat el cost, el temps i la utilitat de fer l'examen de certificació per a tothom.

Com vaig aprovar l'examen de certificació d'enginyer de dades professional de Google Cloud

Alguns dels grans recursos en línia que vaig utilitzar per millorar les meves habilitats abans de l'examen. En ordre: CloudGuru, Acadèmia Linux и Coursera.

Enginyeria de dades a Google Cloud Platform per Coursera

Cost: 49 $ al mes (després de la prova gratuïta de 7 dies)
Temps: 1-2 mesos, més de 10 hores setmanals
Utilitat: 8 / 10

Enginyeria de dades a Google Cloud Platform per Coursera creat en col·laboració amb Google Cloud.

Es divideix en cinc subcursos, cadascun d'ells té unes 10 hores setmanals d'estudi.

Si sou nou en el tractament de dades de Google Cloud, aquesta especialització us portarà del nivell 0 al nivell 1. Completareu una sèrie d'exercicis pràctics mitjançant una plataforma iterativa anomenada QwikLabs. Abans d'això, hi haurà conferències per part dels professionals de Google Cloud sobre com utilitzar diversos serveis com Google BigQuery, Cloud Dataproc, Dataflow i Bigtable.

Introducció de Cloud Guru a Google Cloud Platform

Cost: és gratis
Temps: 1 setmana, 4-6 hores
Utilitat: 4 / 10

No prengui una puntuació d'utilitat baixa com a indicació de la inutilitat del curs. Això està lluny de ser cert. L'únic motiu pel qual obté una puntuació més baixa és perquè no es centra a certificar un enginyer de dades professional (com el seu nom indica).

Després de completar l'especialització de Coursera, vaig fer aquest curs com a actualització perquè només vaig utilitzar Google Cloud per a alguns casos d'ús especialitzats.

Si veniu d'un altre proveïdor de núvol o no heu utilitzat mai Google Cloud abans, és possible que vulgueu fer aquest curs. Aquesta és una gran introducció a Google Cloud Platform en general.

Enginyer de dades professional certificat per Google per la Linux Academy

Cost: 49 $ al mes (després de la prova gratuïta de 7 dies)
Temps: 1-4 setmanes, més de 4 hores setmanals
Utilitat: 10 / 10

Després de completar l'examen i reflexionar sobre els cursos que vaig fer, el més útil va ser Enginyer de dades professional certificat per Google per la Linux Academy.

Vídeo també Dossier de dades eBook (un gran recurs d'aprenentatge gratuït que inclou el curs) i els exàmens de pràctica van fer d'aquest curs un dels millors recursos d'aprenentatge que he utilitzat mai.

Fins i tot el vaig recomanar com a referència en algunes notes de Slack per a l'equip després de l'examen.

Notes a Slack

  • Algunes coses de l'examen no estaven en exàmens a Linux Academy, Cloud Guru o Google Cloud Practice (s'esperava)
  • 1 pregunta amb un gràfic de punts de dades, sobre quina equació hauríeu d'agrupar-los (per exemple, cos(X) o X² + Y²)
  • És imprescindible conèixer les diferències entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub/Sub i com es poden utilitzar.
  • Els dos exemples de treball de recerca de l'examen eren exactament els mateixos que els de la sessió de pràctiques, tot i que no vaig fer referència a aquests estudis durant l'examen (les preguntes donaven una visió suficient).
  • Conèixer la sintaxi bàsica de les consultes SQL és molt útil, especialment per a preguntes de BigQuery.
  • Els exàmens de pràctica que ofereixen Linux Academy i GCP són molt semblants a les preguntes de l'examen, i els treballaré diverses vegades i els utilitzaré per esbrinar els vostres punts febles.
  • Un petit consell per ajudar amb Dataproc: "dataproc el cocodril i Hadoop el pla de l'elefant Espurna un foc i cuinar Rusc of Pigs" {Cocodril dataproc i elefant Hadoop planejant fer un focEspurna - encendre un foc - fer un foc) i cuinar un eixam (Rusc) porcs (Porc)} (Dataproc tracta amb Hadoop, Spark, Hive i Pig)
  • «Flux de dades és un corrent Fes de llum" {Flux de dades aquest és el feix actual (Fes) light} (Dataflow tracta amb Apache Beam)
  • "Tots a tot el món pot relacionar-se amb a rentat amb ÀCID ben fet Llau clau" {Qualsevol a tot el món podria tractar amb àcid purificat (ÀCID) amb una clau sòlida (Spanner)} (Cloud Spanner és una base de dades dissenyada per augmentar el núvol des de zero, compatible amb ACID i disponible a tot el món)
  • Pot ser útil conèixer els noms de bases de dades relacionals i no relacionals clàssiques (per exemple, MongoDB, Cassandra)
  • Les funcions d'IAM varien lleugerament per a cada servei, però és útil entendre com separar els usuaris de poder veure les dades sense eliminar la capacitat de dissenyar fluxos de treball (p. ex., el rol de "Treballador de flux de dades" pot dissenyar fluxos de treball però no veure dades).

Això probablement és suficient per ara. El quilometratge probablement variarà d'un examen a un altre. El curs de Linux Academy us donarà el 80% dels coneixements.

Vídeos de Google Cloud d'1 minut

Cost: és gratis
Temps: 1-2 hores
Utilitat: 5 / 10

S'han recomanat als fòrums de Cloud Guru. Molts d'ells no estaven relacionats amb la certificació Professional Data Engineer, però n'he seleccionat alguns que sí.

Alguns serveis poden semblar complicats a l'hora de seguir el curs, així que va ser agradable escoltar com es descriu un servei concret en un minut.

Preparació per a l'examen d'Enginyer de dades professional al núvol

Cost: 49 $ per certificat o gratuït (sense certificat)
Temps: 1-2 setmanes, més de 6 hores setmanals
Utilitat: N / A

Vaig trobar aquest recurs el dia abans del meu examen programat. No el vaig acabar per limitacions de temps, d'aquí la manca d'una qualificació d'utilitat.

Tanmateix, des de la pàgina de visió general del curs, sembla un recurs fantàstic per reunir tot el que heu après sobre l'Enginyeria de dades de Google Cloud i destacar-ne els punts febles.

Vaig recomanar aquest curs com a recurs a un dels meus companys que s'està preparant per a la certificació.

Full de trucs d'enginyeria de dades de Google de Maverick Lin

Cost: és gratis
Temps: N/A
Utilitat: N/A

Aquest va ser un altre recurs amb què em vaig trobar després de l'examen. Al meu entendre, és complet, però alhora concís. A més, és gratuït. Es pot utilitzar per llegir entre exàmens de pràctica o fins i tot després de la certificació per millorar els coneixements.

Què vaig fer després del curs?

A mesura que m'acostava al final dels meus cursos, vaig reservar l'examen amb una setmana d'antelació.
Tenir una data límit és una gran motivació per reforçar el que has après.

Vaig fer repetidament els exàmens de pràctica de Linux Academy i Google Cloud fins que vaig poder completar-los amb un 95% més de precisió cada vegada.

Com vaig aprovar l'examen de certificació d'enginyer de dades professional de Google Cloud
Aprovar l'examen de pràctica de Linux Academy en més d'un 90% per primera vegada.

Les proves de cada plataforma són similars, però vaig trobar que, al recórrer les preguntes, m'equivocava constantment i escriure per què les vaig entendre malament em va ajudar a endurir els meus punts febles.

L'examen que vaig fer va utilitzar com a tema dos exemples de projectes de recerca per desenvolupar sistemes de processament de dades a Google Cloud (a partir del 29 de març de 2019, això ha canviat). I va ser amb elecció múltiple a tot arreu.

Vaig trigar unes 2 hores. I va ser aproximadament un 20% més difícil que qualsevol dels exàmens que vaig fer.

No puc expressar prou el valor dels exàmens pràctics.

Què canviaria si tornés a anar?

Més exàmens de pràctica. Més coneixements pràctics.

Per descomptat, sempre hi ha més preparació que pots fer.

El requisit recomanat indica més de 3 anys d'ús de GCP. Però no el tenia, així que vaig haver de fer front al que tenia.

a més

L'examen es va actualitzar el 29 de març. El material presentat en aquest article encara proporciona una bona base, però és important tenir en compte alguns canvis.

Diverses seccions de l'examen de Google Cloud Professional Data Engineer (versió de 1)

  1. Disseny de sistemes de tractament de dades
  2. Creació i suport d'estructures i bases de dades.
  3. Anàlisi de dades i connexió d'aprenentatge automàtic
  4. Modelització de processos de negoci per a l'anàlisi i optimització
  5. Assegurant la fiabilitat
  6. Visualització de dades i suport polític
  7. Dissenyat per a la seguretat i el compliment

Diverses seccions de l'examen de Google Cloud Professional Data Engineer (versió de 2)

  1. Disseny de sistemes de tractament de dades
  2. Construcció i funcionament de sistemes de tractament de dades
  3. Operació dels models d'aprenentatge automàtic (la majoria dels canvis es van produir aquí) [NOU]
  4. Garantir la qualitat de les decisions

La versió 2 va fusionar les seccions 1, 2, 4 i 6 de la versió 1 en 1 i 2. També va fusionar les seccions 5 i 7 de la versió 1 a la secció 4. I la secció 3 de la versió 2 es va ampliar per cobrir tot el nou Google Cloud Capacitats d'aprenentatge automàtic.

Com que aquests canvis són tan recents, molts dels materials d'aprenentatge no s'han pogut actualitzar.

Tanmateix, familiaritzar-se amb els materials d'aquest article hauria de ser suficient per cobrir el 70% del que necessiteu. Combinaria això amb algunes de les vostres pròpies investigacions sobre les preguntes següents (que es van presentar a la segona versió de l'examen).

Com podeu veure, l'última actualització de l'examen es va centrar en les funcions de ML a Google Cloud.

Actualització el 29/04/2019: Un missatge de l'instructor del curs de l'Acadèmia Linux, Matthew Ulasein.
Només com a referència, estem planejant actualitzar el curs d'enginyer de dades a l'Acadèmia Linux per reflectir els nous cursos que començaran a mitjans/finals de maig.

Després de l'examen

Quan aprovi l'examen, només rebrà un resultat d'aprovat o no. Aconsello apuntar com a mínim al 70%, així que vaig apuntar a un mínim del 90% als exàmens de pràctica.

Un cop finalitzat, rebràs un codi de bescanvi per correu electrònic juntament amb la certificació oficial de Google Cloud Professional Data Engineer. Felicitats!

Pots fer servir el codi de bescanvi a l'exclusiu Google Cloud Professional Data Engineer Store, que està ple de swag (SWAG). Hi ha samarretes, motxilles i dessuadores amb caputxa (pot ser que no estiguin en estoc quan hi arribis). Vaig triar dessuadores amb caputxa.

Ara que estàs certificat, pots mostrar el teu conjunt d'habilitats (oficialment) i tornar al que millor saps, construir.

Ens veiem d'aquí a dos anys per tornar a certificar.

PS: Si tens qualsevol dubte o vols un aclariment, pots contactar amb mi a Twitter и LinkedIn. Encès YouTube també hi ha una versió en vídeo d'aquest article.
PPS: moltes gràcies a tots els meravellosos professors en tots els cursos anteriors i Max Kelsen per oferir recursos i temps per estudiar i preparar l'examen.

I tots els que vulguin aprendre més sobre el programa del curs, les característiques del format en línia, les habilitats, les competències i les perspectives que esperen els graduats després de la formació, us convidem a Dia obert, que tindrà lloc avui a les 20.00 hores.

Font: www.habr.com

Afegeix comentari