Come ho superato l'esame di certificazione Google Cloud Professional Data Engineer

Senza i 3 anni di esperienza pratica consigliati

Prima dell'inizio del corso Ingegnere dei dati, vogliamo condividere con voi la traduzione di una storia molto interessante, che sarà sicuramente utile ai futuri ingegneri dei dati. Andare!

Come ho superato l'esame di certificazione Google Cloud Professional Data Engineer
Felpa con cappuccio di Google: indossala. Espressione facciale lavorativa seria: presente. Foto dalla versione video di questo articolo in poi YouTube.

Nota. Questo articolo riguarda l'esame di certificazione Google Cloud Professional Data Engineer fino al 29 marzo 2019. Da questa data ci sono stati alcuni cambiamenti. Li ho inclusi nella sezione Extra.

Allora, vuoi prenderti una nuova felpa con cappuccio, come sulla mia copertina? Oppure stai pensando di ottenere la certificazione? Ingegnere dei dati professionale di Google Cloud e chiedendosi come farlo.

Negli ultimi mesi ho seguito corsi e utilizzo Google Cloud per prepararmi all'esame Professional Data Engineer. Poi ho provato a passarlo e l'ho superato. E poche settimane dopo mi è stata consegnata la felpa con cappuccio. Il certificato è arrivato velocemente.

Questo articolo elenca alcune cose che potresti voler sapere e i passaggi che ho seguito per ottenere la certificazione Google Cloud Professional Data Engineer.

Perché vorresti ottenere la certificazione come Google Cloud Professional Data Engineer?

I dati sono ovunque. Inoltre, è necessario sapere come costruire sistemi in grado di elaborare e utilizzare i dati. Google Cloud fornisce l'infrastruttura per creare questi sistemi.

Potresti già avere le competenze per utilizzare Google Cloud, ma come lo dimostrerai a un futuro datore di lavoro o cliente? Ci sono due modalità: portfolio di progetti o certificazione.

Il certificato dice ai potenziali clienti e datori di lavoro: "Ho le competenze e mi sono impegnato per ottenere l'accreditamento".

Una breve descrizione di Google lo riassume.

Dimostra la tua capacità di progettare e realizzare sistemi di dati e creare modelli di machine learning su Google Cloud Platform.

Se non disponi già delle competenze, seguire i tutorial di certificazione significa che imparerai tutto su come creare sistemi dati di livello mondiale su Google Cloud.

Chi vorrebbe ottenere la certificazione come Google Cloud Professional Data Engineer?

Hai visto i numeri. La nuvola sta crescendo. E' già qui e non andrà da nessuna parte. Se non hai ancora visto i numeri, fidati, la nube sta crescendo.

Che tu sia già un Data Scientist, Data Engineer, Data Analyst, Machine Learning Engineer o cerchi un'opportunità di carriera nel mondo dei dati, la certificazione Google Cloud Professional Data Engineer è per te.

La capacità di utilizzare il cloud sta diventando un requisito per qualsiasi posizione incentrata sui dati.

Hai bisogno di una certificazione per essere un buon ingegnere dei dati/scienziato dei dati/ingegnere dell'apprendimento automatico?

No.

Puoi comunque utilizzare Google Cloud per soluzioni di trasferimento dati senza certificato.

Un certificato è solo uno dei metodi per convalidare le competenze esistenti.

Stanno in piedi?

Il costo dell’esame è di $ 200. Se fallisci, dovrai pagare nuovamente per un nuovo tentativo.

Potrebbero esserci dei costi associati ai corsi preparatori e all'utilizzo della piattaforma stessa.

I costi della piattaforma sono costi per l'utilizzo dei servizi Google Cloud. Se sei un utente sofisticato, ne sei già consapevole. In caso contrario, e hai appena iniziato con i tutorial trattati in questo articolo, puoi creare un nuovo account Google Cloud e rimanere entro i $ 300 offerti da Google al momento della registrazione.

Tra un secondo parleremo del costo del corso.

Quanto tempo è valida la certificazione?

2 anni. Dopodiché dovrai sostenere nuovamente l'esame.

E poiché Google Cloud si evolve ogni giorno, è probabile che ciò che è richiesto per un certificato cambierà (come ho scoperto, era già cambiato quando ho iniziato a scrivere questo articolo).

Cosa ti serve per prepararti all'esame?

Google consiglia almeno 3 anni di esperienza nel settore e più di 1 anno di sviluppo e gestione di soluzioni utilizzando GCP per la certificazione di livello professionale.

Non avevo niente di quanto sopra.

Sulla base di 6 mesi di esperienza rilevante. Per compensare il deficit, ho utilizzato una combinazione di risorse di apprendimento online.

Che corsi ho seguito?

Se sei come me e non possiedi i requisiti consigliati, puoi seguire alcuni dei seguenti corsi per migliorare le tue abilità.

I seguenti corsi sono quelli che ho utilizzato per prepararmi alla certificazione. Sono elencati in ordine di completamento.

Ho elencato per tutti i costi, i tempi e l'utilità di sostenere l'esame di certificazione.

Come ho superato l'esame di certificazione Google Cloud Professional Data Engineer

Alcune delle fantastiche risorse online che ho utilizzato per migliorare le mie capacità prima dell'esame. Al fine: Guru delle nuvole, Linux Academy и Coursera.

Ingegneria dei dati su Google Cloud Platform di Coursera

costo: $ 49 al mese (dopo una prova gratuita di 7 giorni)
Tempo: 1-2 mesi, 10+ ore settimanali
utilità: 8 / 10

Ingegneria dei dati su Google Cloud Platform di Coursera realizzato in collaborazione con Google Cloud.

È suddiviso in cinque sottocorsi, ciascuno dei quali richiede circa 10 ore settimanali di studio.

Se sei nuovo nell'elaborazione dei dati di Google Cloud, questa specializzazione ti porterà dal livello 0 al livello 1. Completerai una serie di esercizi pratici utilizzando una piattaforma iterativa chiamata QwikLabs. Prima di ciò, ci saranno lezioni tenute da professionisti di Google Cloud su come utilizzare vari servizi come Google BigQuery, Cloud Dataproc, Dataflow e Bigtable.

Introduzione di Cloud Guru a Google Cloud Platform

costo: Gratuito
Tempo: 1 settimana, 4-6 ore
utilità: 4 / 10

Non prendere un punteggio di utilità basso come un'indicazione dell'inutilità del corso. Questo è tutt'altro che vero. L'unico motivo per cui ottiene un punteggio più basso è perché non è focalizzato sulla certificazione di un ingegnere di dati professionista (come suggerisce il nome).

Dopo aver completato la specializzazione Coursera, ho seguito questo corso come aggiornamento perché ho utilizzato Google Cloud solo per alcuni casi d'uso specializzati.

Se provieni da un altro fornitore di servizi cloud o non hai mai utilizzato Google Cloud prima, potresti voler seguire questo corso. Questa è un'ottima introduzione a Google Cloud Platform in generale.

Ingegnere di dati professionale certificato Google dalla Linux Academy

costo: $ 49 al mese (dopo una prova gratuita di 7 giorni)
Tempo: 1-4 settimane, 4+ ore a settimana
utilità: 10 / 10

Dopo aver completato l'esame e aver riflettuto sui corsi che ho seguito, il più utile è stato Ingegnere di dati professionale certificato Google dalla Linux Academy.

Anche il video eBook Fascicolo dati (un'ottima risorsa di apprendimento gratuita fornita con il corso) e gli esami pratici hanno reso questo corso una delle migliori risorse di apprendimento che abbia mai utilizzato.

L'ho anche consigliato come riferimento in alcune note di Slack per il team dopo l'esame.

Note in Slack

  • Alcuni argomenti dell'esame non erano presenti negli esami di Linux Academy, Cloud Guru o Google Cloud Practice (previsto)
  • 1 domanda con un grafico di punti dati, su quale equazione dovresti raggrupparli (ad esempio, cos(X) o X² + Y²)
  • Conoscere le differenze tra Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub/Sub e come possono essere utilizzati è un must.
  • I due esempi pratici di ricerca nell'esame erano esattamente gli stessi di quelli nella sessione pratica, anche se non ho fatto alcun riferimento a questi studi durante l'esame (le domande hanno fornito informazioni sufficienti).
  • Conoscere la sintassi di base delle query SQL è molto utile, soprattutto per le domande su BigQuery.
  • Gli esami pratici forniti da Linux Academy e GCP sono molto simili nello stile alle domande d'esame e li esaminerò più volte e li userò per scoprire i tuoi punti deboli.
  • Un piccolo consiglio per aiutare con Dataproc: “Data proc il coccodrillo e Hadoop il piano dell'elefante Scintilla un fuoco e cuocere Alveare of Pigs" {Coccodrillo Data proc ed elefante Hadoop progettando di accendere un fuocoScintilla - scintilla, accendi un fuoco - accendi un fuoco) e cuoci uno sciame (Alveare) suini (Maiale)} (Dataproc si occupa di Hadoop, Spark, Hive e Pig)
  • «Flusso di dati è un flusso Larghezza di luce" {Flusso di dati questo è il raggio attuale (Larghezza) light} (Dataflow si occupa di Apache Beam)
  • "Tutti Intorno al mondo può riguardare a ACID ben fatto lavato Chiave inglese" {Chiunque in tutto il mondo potrebbe trattare con acido purificato (ACIDO) con una solida chiave inglese (Spanner)} (Cloud Spanner è un database progettato per creare il cloud da zero, conforme ad ACID e disponibile in tutto il mondo)
  • Può essere utile conoscere i nomi dei classici database relazionali e non relazionali (ad esempio MongoDB, Cassandra)
  • I ruoli IAM variano leggermente per ogni servizio, ma è utile capire come impedire agli utenti di vedere i dati senza togliere loro la capacità di progettare flussi di lavoro (ad esempio, il ruolo "Dataflow Worker" può progettare flussi di lavoro ma non vedere dati)

Questo probabilmente è sufficiente per ora. Il chilometraggio probabilmente differirà da esame a esame. Il corso Linux Academy ti fornirà l'80% delle conoscenze.

Video Google Cloud di 1 minuto

costo: Gratuito
Tempo: 1-2 ore
utilità: 5 / 10

Sono stati consigliati sui forum Cloud Guru. Molti di essi non erano correlati alla certificazione Professional Data Engineer, ma ne ho selezionati alcuni che lo sono.

Alcuni servizi possono sembrare complicati durante lo svolgimento del corso, quindi è stato bello sentire come viene descritto un particolare servizio in un minuto.

Preparazione per l'esame Cloud Professional Data Engineer

costo: $49 per certificato o gratuito (senza certificato)
Tempo: 1-2 settimane, 6+ ore settimanali
utilità: N / A

Ho trovato questa risorsa il giorno prima del mio esame programmato. Non l'ho finito a causa dei limiti di tempo, da qui la mancanza di una valutazione di utilità.

Tuttavia, dalla pagina di panoramica del corso, sembra un'ottima risorsa per mettere insieme tutto ciò che hai imparato su Google Cloud Data Engineering ed evidenziare eventuali punti deboli.

Ho consigliato questo corso come risorsa a uno dei miei colleghi che si sta preparando per la certificazione.

Cheat sheet di ingegneria dei dati di Google di Maverick Lin

costo: Gratuito
Tempo:N / A
utilità:N / A

Questa è stata un'altra risorsa in cui mi sono imbattuto dopo l'esame. Secondo me è esaustivo, ma allo stesso tempo conciso. Inoltre, è gratuito. Può essere utilizzato per la lettura tra gli esami pratici o anche dopo la certificazione per rispolverare le conoscenze.

Cosa ho fatto dopo il corso?

Man mano che mi avvicinavo alla fine dei corsi, ho prenotato l'esame con una settimana di preavviso.
Avere una scadenza è un'ottima motivazione per rafforzare ciò che hai imparato.

Ho sostenuto ripetutamente gli esami pratici di Linux Academy e Google Cloud finché non sono riuscito a completarli ogni volta con una precisione superiore al 95%.

Come ho superato l'esame di certificazione Google Cloud Professional Data Engineer
Superamento dell'esame pratico della Linux Academy con oltre il 90% per la prima volta.

I test di ciascuna piattaforma sono simili, ma ho scoperto che rispondendo alle domande sbagliavo costantemente e scrivere il motivo per cui le avevo fraintese mi ha aiutato a rafforzare i miei punti deboli.

L'esame che ho sostenuto utilizzava come argomento due progetti di ricerca campione per lo sviluppo di sistemi di elaborazione dati su Google Cloud (dal 29 marzo 2019 questo è cambiato). Ed era a scelta multipla ovunque.

Mi ci sono volute circa 2 ore. Ed è stato circa il 20% più difficile di qualsiasi esame che ho sostenuto.

Non potrò esprimere abbastanza il valore degli esami pratici.

Cosa cambierei se tornassi?

Altri esami pratici. Conoscenza più pratica.

Naturalmente, c'è sempre più preparazione che potresti fare.

Il requisito consigliato prevede più di 3 anni di utilizzo di GCP. Ma non ce l'avevo, quindi ho dovuto fare i conti con quello che avevo.

Inoltre

L'esame è stato aggiornato il 29 marzo. Il materiale presentato in questo articolo fornisce ancora una buona base, ma è importante notare alcuni cambiamenti.

Varie sezioni dell'esame Google Cloud Professional Data Engineer (versione di 1)

  1. Progettazione di sistemi di elaborazione dati
  2. Creazione e supporto di strutture e database.
  3. Analisi dei dati e connessione al machine learning
  4. Modellazione dei processi aziendali per l'analisi e l'ottimizzazione
  5. Garantire l'affidabilità
  6. Visualizzazione dei dati e supporto alle politiche
  7. Progettato per la sicurezza e la conformità

Varie sezioni dell'esame Google Cloud Professional Data Engineer (versione di 2)

  1. Progettazione di sistemi di elaborazione dati
  2. Costruzione e gestione di sistemi di elaborazione dati
  3. Operazionalizzazione dei modelli di machine learning (la maggior parte dei cambiamenti sono avvenuti qui) [NUOVO]
  4. Garantire la qualità delle soluzioni

La versione 2 ha unito le sezioni 1, 2, 4 e 6 della versione 1 in 1 e 2. Ha inoltre unito le sezioni 5 e 7 della versione 1 nella sezione 4. Inoltre, la sezione 3 della versione 2 è stata ampliata per coprire tutto il nuovo Google Cloud Funzionalità di apprendimento automatico.

Poiché questi cambiamenti sono così recenti, non è stato possibile aggiornare molti materiali didattici.

Tuttavia, familiarizzare con i materiali contenuti in questo articolo dovrebbe essere sufficiente a coprire il 70% di ciò di cui hai bisogno. Vorrei combinare questo con alcune delle tue ricerche sulle seguenti domande (che sono state presentate nella seconda versione dell'esame).

Come puoi vedere, l'ultimo aggiornamento dell'esame si è concentrato sulle funzionalità ML in Google Cloud.

Aggiornamento 29/04/2019: Un messaggio dall'istruttore del corso Linux Academy Matthew Ulasein.
Giusto per riferimento, stiamo pianificando di aggiornare il corso Data Engineer presso la Linux Academy per riflettere i nuovi corsi che inizieranno a metà/fine maggio.

Dopo l'esame

Quando superi l'esame, riceverai solo un risultato superato o fallito. Consiglio di puntare ad almeno il 70%, quindi ho puntato ad un minimo del 90% negli esami pratici.

Al termine, riceverai un codice di riscatto via email insieme alla certificazione ufficiale Google Cloud Professional Data Engineer. Congratulazioni!

Puoi utilizzare il codice di riscatto nell'esclusivo Google Cloud Professional Data Engineer Store, che è pieno zeppo di gadget (MALLOPPO, FESTONE). Ci sono magliette, zaini e felpe con cappuccio (potrebbero non essere in stock quando arrivi). Ho scelto le felpe con cappuccio.

Ora che hai ottenuto la certificazione, puoi mettere in mostra le tue abilità (ufficialmente) e tornare a fare ciò che sai fare meglio: costruire.

Ci vediamo tra due anni per ricertificarsi.

PS: Se avete domande o desiderate chiarimenti potete contattarmi all'indirizzo Twitter и LinkedIn. su YouTube C'è anche una versione video di questo articolo.
PPS: molte grazie a tutti i meravigliosi insegnanti di tutti i corsi di cui sopra e Max Kelsen per aver fornito risorse e tempo per studiare e prepararsi all'esame.

E tutti coloro che vogliono conoscere meglio il programma del corso, le caratteristiche del formato online, le abilità, le competenze e le prospettive che attendono i laureati dopo la formazione, li invitiamo a Giornata Aperta, che si svolgerà oggi alle ore 20.00.

Fonte: habr.com

Aggiungi un commento