Comment j'ai réussi l'examen de certification Google Cloud Professional Data Engineer

Sans les 3 années d'expérience pratique recommandées

En prévision du début des cours Ingénieur de données, nous souhaitons partager avec vous la traduction d'une histoire très intéressante, qui sera certainement utile aux futurs ingénieurs de données. Aller!

Comment j'ai réussi l'examen de certification Google Cloud Professional Data Engineer
Sweat à capuche Google : porté. Expression faciale sérieuse et travaillante : présente. Photo de la version vidéo de cet article sur YouTube.

Note. Cet article concerne l'examen de certification Google Cloud Professional Data Engineer qui doit avoir lieu le 29 mars 2019. Après cette date, certains changements se sont produits. Je les ai inclus dans la section Extras.

Alors, tu veux t'acheter un nouveau sweat à capuche comme celui sur ma couverture ? Ou envisagez-vous d'obtenir un certificat? Ingénieur de données professionnel Google Cloud et je me demande comment faire.

Au cours des derniers mois, j'ai suivi des cours tout en utilisant Google Cloud pour préparer l'examen Professional Data Engineer. Ensuite, j'ai essayé de le réussir et j'ai réussi. Et quelques semaines plus tard, mon sweat à capuche est arrivé. Le certificat est arrivé plus rapidement.

Cet article répertorie quelques éléments que vous voudrez peut-être savoir et les étapes que j'ai suivies pour devenir certifié en tant qu'ingénieur de données professionnel Google Cloud.

Pourquoi voudriez-vous devenir certifié en tant qu'ingénieur de données professionnel Google Cloud ?

Les données sont partout. Et savoir comment créer des systèmes capables de traiter et d’utiliser les données est très demandé. Google Cloud fournit l'infrastructure nécessaire à la création de ces systèmes.

Vous possédez peut-être déjà les compétences nécessaires pour utiliser Google Cloud, mais comment allez-vous le démontrer à un futur employeur ou client ? Il existe deux voies : portefeuille de projets ou certification.

Le certificat indique aux futurs clients et employeurs : « J’ai les compétences et j’ai fait l’effort d’être accrédité ».

La brève description de Google le résume.

Démontrez votre capacité à concevoir et à créer des systèmes de traitement de données, ainsi qu'à créer des modèles d'apprentissage automatique sur Google Cloud Platform.

Si vous ne possédez pas déjà les compétences, en parcourant les supports de formation à la certification, vous apprendrez tout sur la façon de créer des systèmes de données de classe mondiale sur Google Cloud.

Qui souhaiterait devenir certifié Google Cloud Professional Data Engineer ?

Vous avez vu les chiffres. Le cloud grandit. Il est déjà là et ne va nulle part. Si vous n'avez pas encore vu les chiffres, croyez-moi, le cloud s'agrandit.

Si vous êtes déjà un data scientist, un ingénieur de données, un analyste de données, un ingénieur en machine learning ou si vous recherchez une carrière dans le monde des données, la certification Google Cloud Professional Data Engineer est faite pour vous.

La capacité cloud devient une exigence pour tout poste centré sur les données.

Avez-vous besoin d'un certificat pour être un bon ingénieur de données/scientifique de données/ingénieur en apprentissage automatique ?

Non.

Vous pouvez toujours utiliser Google Cloud pour les solutions de données sans certificat.

Un certificat n'est qu'une méthode parmi d'autres pour valider les compétences existantes.

Combien cela coûte-t-il?

Les frais d'examen sont de 200 $. Si vous échouez, vous devrez payer à nouveau pour réessayer.

Il peut y avoir des coûts associés aux formations et à l’utilisation de la plateforme elle-même.

Les coûts de la plate-forme correspondent aux frais d'utilisation des services Google Cloud. Si vous êtes un utilisateur averti, vous en êtes déjà conscient. Si ce n'est pas le cas, et que vous commencez tout juste à suivre les didacticiels de cet article, vous pouvez créer un nouveau compte Google Cloud et rester dans les limites des offres Google de 300 $ lors de votre inscription.

Nous aborderons le coût du cours dans une seconde.

Quelle est la durée de validité de la certification ?

2 ans. Après cela, vous devrez repasser l’examen.

Et comme Google Cloud évolue chaque jour, il est probable que ce qui est requis pour un certificat changera (comme je l'ai découvert, cela avait déjà changé au moment où j'ai commencé à écrire cet article).

De quoi avez-vous besoin pour préparer l’examen ?

Google recommande au moins 3 ans d'expérience dans le secteur et au moins 1 an de développement et de gestion de solutions utilisant GCP pour une certification de niveau professionnel.

Je n'avais rien de ce qui précède.

Au maximum 6 mois d'expérience pertinente. Pour compenser ce manque, j'ai utilisé une combinaison de ressources d'apprentissage en ligne.

Quels cours ai-je suivis ?

Si vous êtes comme moi et que vous ne répondez pas aux exigences recommandées, vous pouvez suivre certains des cours suivants pour améliorer vos qualifications.

Les cours suivants sont ce que j'ai utilisé pour préparer la certification. Ils sont classés par ordre d'achèvement.

J'ai énuméré le coût, le calendrier et l'utilité de passer l'examen de certification pour chacun.

Comment j'ai réussi l'examen de certification Google Cloud Professional Data Engineer

Certaines des excellentes ressources en ligne que j'ai utilisées pour améliorer mes compétences avant l'examen. En ordre: Gourou du nuage, Académie Linux и Coursera.

Ingénierie des données sur Google Cloud Platform de Coursera

coût de: 49 $/mois (après 7 jours d'essai gratuit)
temps: 1 à 2 mois, 10+ heures par semaine
utilité: 8 / 10

Ingénierie des données sur Google Cloud Platform de Coursera créé en collaboration avec Google Cloud.

Il est divisé en cinq sous-cours, dont chacun prend environ 10 heures par semaine d'enseignement.

Si vous débutez dans la science des données Google Cloud, cette spécialisation vous fera passer du niveau 0 au niveau 1. Vous passerez par une série d'exercices pratiques à l'aide d'une plate-forme itérative appelée QwikLabs. Avant cela, des praticiens de Google Cloud donneront des conférences sur la façon d'utiliser divers services tels que Google BigQuery, Cloud Dataproc, Dataflow et Bigtable.

Présentation de Cloud Guru à Google Cloud Platform

coût deGratuit
temps: 1 semaine, 4 à 6 heures
utilité: 4 / 10

Ne considérez pas un faible score d’utilité comme une indication que le cours n’est pas utile. C'est loin d'être vrai. La seule raison pour laquelle il obtient un score inférieur est qu'il n'est pas axé sur la certification Professional Data Engineer (comme son nom l'indique).

Après avoir terminé la spécialisation Coursera, j'ai considéré ce cours comme une remise à niveau car je n'avais utilisé Google Cloud que pour quelques cas d'utilisation spécialisés.

Si vous venez d'un autre fournisseur de cloud ou si vous n'avez jamais utilisé Google Cloud auparavant, vous souhaiterez peut-être suivre ce cours. Il s'agit d'une excellente introduction à Google Cloud Platform en général.

Ingénieur de données professionnel certifié Google de la Linux Academy

coût de: 49 $/mois (après 7 jours d'essai gratuit)
temps: 1 à 4 semaines, 4+ heures par semaine
utilité: 10 / 10

Après avoir passé l'examen et réfléchi aux cours que j'ai suivis, ce qui m'a été le plus utile a été Ingénieur de données professionnel certifié Google de la Linux Academy.

La vidéo aussi Livre électronique sur le dossier de données (une excellente ressource d'apprentissage gratuite fournie avec le cours) et des examens pratiques ont fait de ce cours l'une des meilleures ressources d'apprentissage que j'ai jamais utilisées.

Je l'ai même recommandé comme référence dans certaines notes Slack à l'équipe après l'examen.

Notes dans Slack

  • Certaines choses de l'examen ne figuraient pas dans les examens de Linux Academy, Cloud Guru ou Google Cloud Practice (à prévoir)
  • 1 question avec un graphique de points de données sur l'équation avec laquelle vous devez les regrouper (par exemple cos(X) ou X² + Y²)
  • Connaître les différences entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub/Sub et comment ils peuvent être utilisés est indispensable.
  • Les deux exemples concrets des études de l'examen étaient exactement les mêmes que ceux des séances pratiques, même si je n'ai pas du tout fait référence à ces études pendant l'examen (les questions permettaient une compréhension suffisante).
  • Connaître la syntaxe de base des requêtes SQL est très utile, en particulier pour les questions BigQuery.
  • Les examens pratiques proposés par Linux Academy et GCP sont très similaires dans leur style aux questions d'examen, et je vais les parcourir plusieurs fois et les utiliser pour déterminer vos points faibles.
  • Un petit conseil pour vous aider avec Dataproc : "Procédure de données le croco et Hadoop l'éléphant projette de Spark un feu et cuire un Ruche of Porcs" {Crocodile Procédure de données et l'éléphant Hadoop je prévois de faire un feu (Spark - allumer, allumer un feu - faire un feu) et préparer un essaim (Ruche) les cochons (Cochon)} (Dataproc traite Hadoop, Spark, Hive et Pig)
  • «Flux de données est un fluide Faisceau de la lumière" {Flux de données c'est le rayon actuel (Faisceau) light} (Dataflow traite avec Apache Beam)
  • "Tout le monde autour du monde peut se rapporter à un bien fait, lavé à l'ACIDE Clé" {Tout le monde dans le monde entier pourrait traiter de l'acide purifié (ACID) avec une bonne clé (Spanner)} (Cloud Spanner est une base de données conçue pour faire décoller le cloud, conforme à l'ACID et disponible dans le monde entier)
  • Il peut être utile de connaître les noms des versions classiques des bases de données relationnelles et non relationnelles (par exemple MongoDB, Cassandra)
  • Les rôles IAM sont légèrement différents pour chaque service, mais il est utile de comprendre comment empêcher les utilisateurs de voir les données sans supprimer la possibilité de concevoir des workflows (par exemple, le rôle « Dataflow Worker » peut concevoir des workflows mais pas voir les données. )

C'est probablement suffisant pour le moment. Le kilométrage variera probablement d’un examen à l’autre. Le cours Linux Academy vous donnera 80% des connaissances.

Vidéos Google Cloud d'une minute

coût deGratuit
temps: 1-2 heures
utilité: 5 / 10

Ils ont été recommandés sur les forums Cloud Guru. Beaucoup d’entre eux n’étaient pas liés à la certification Professional Data Engineer, cependant, j’en ai sélectionné quelques-uns qui conviennent.

Certains services peuvent sembler difficiles à naviguer tout au long du cours, c'était donc agréable d'entendre un service particulier décrit en une minute.

Préparation à l'examen Cloud Professional Data Engineer

coût de: 49$ par certificat ou gratuit (sans certificat)
temps: 1 à 2 semaines, 6+ heures par semaine
utilité: N / A

J'ai trouvé cette ressource la veille de la date prévue de mon examen. Je ne l'ai pas terminé faute de temps, d'où le manque de note d'utilité.

Cependant, d'après la page de présentation du cours, cela semble être une excellente ressource pour rassembler tout ce que vous avez appris sur l'ingénierie des données sur Google Cloud et mettre en évidence les points faibles.

J'ai recommandé ce cours comme ressource à un de mes collègues qui se prépare à la certification.

Aide-mémoire sur l'ingénierie des données Google par Meverik Lin

coût deGratuit
temps:N / A
utilité:N / A

C'est une autre ressource que j'ai découverte après l'examen. À mon avis, il est complet, mais en même temps concis. De plus, c'est gratuit. Il peut être utilisé pour lire entre les examens pratiques ou même après la certification pour parfaire ses connaissances.

Qu'ai-je fait après le cours ?

Alors que j'approchais de la fin du cours, j'ai réservé l'examen avec une semaine de préavis.
Avoir une date limite est une excellente motivation pour renforcer ce que vous avez appris.

J'ai passé des examens pratiques de Linux Academy et de Google Cloud à plusieurs reprises jusqu'à ce que je puisse les terminer avec une précision de plus de 95 % à chaque fois.

Comment j'ai réussi l'examen de certification Google Cloud Professional Data Engineer
J'ai réussi l'examen pratique de la Linux Academy avec plus de 90 % pour la première fois.

Les tests de chaque plate-forme sont similaires, mais j'ai constaté que le fait de répondre aux questions sur lesquelles je me trompais sans cesse et d'écrire pourquoi je me trompais m'a aidé à resserrer mes points faibles.

L'examen que j'ai passé utilisait comme sujet deux exemples de projets de recherche pour le développement de systèmes de données sur Google Cloud (cela a changé depuis le 29 mars 2019). Et c'était à choix multiples tout au long.

Cela m'a pris environ 2 heures. Et c'était environ 20 % plus difficile que n'importe lequel des examens que j'ai passés.

Je ne saurais trop exprimer la valeur des examens pratiques.

Qu'est-ce que je changerais si j'y retournais ?

Plus d'examens pratiques. Plus de connaissances pratiques.

Bien sûr, vous pouvez toujours faire davantage de préparation.

Les exigences recommandées incluent plus de trois ans d'utilisation de GCP. Mais je n’avais pas ça, alors j’ai dû faire avec ce que j’avais.

en outre

L'examen a été mis à jour le 29 mars. Le matériel présenté dans cet article constitue toujours une bonne base, mais il est important de noter quelques changements.

Différentes sections de l'examen Google Cloud Professional Data Engineer (Version 1)

  1. Conception de systèmes de traitement de données
  2. Création et support de structures et de bases de données.
  3. Analyse des données et connexion au machine learning
  4. Modélisation des processus métier pour l'analyse et l'optimisation
  5. Assurer la fiabilité
  6. Visualisation des données et soutien aux politiques
  7. Concevoir pour la sécurité et la conformité

Différentes sections de l'examen Google Cloud Professional Data Engineer (Version 2)

  1. Conception de systèmes de traitement de données
  2. Construction et exploitation de systèmes de traitement de données
  3. Opérationnalisation des modèles d'apprentissage automatique (la plupart des changements ont eu lieu ici) [NOUVEAU]
  4. Garantir la qualité des solutions

La version 2 combinait les sections 1, 2, 4 et 6 de la version 1 en 1 et 2. Elle combinait également les sections 5 et 7 de la version 1 en section 4. Et la section 3 de la version 2 a été étendue pour couvrir l'ensemble de la nouvelle machine de Google Cloud. capacités d’apprentissage.

Ces changements étant si récents, de nombreux matériels d’apprentissage n’ont pas eu l’occasion d’être mis à jour.

Cependant, la lecture de cet article devrait suffire à couvrir 70 % de ce dont vous avez besoin. Je combinerais cela avec certaines de vos propres recherches sur les questions suivantes (celles-ci ont été présentées dans la deuxième version de l'examen).

Comme vous pouvez le constater, la dernière mise à jour de l'examen s'est concentrée sur les capacités ML de Google Cloud.

Mise à jour 29/04/2019: message de Matthew Ulasein, professeur de cours à la Linux Academy.
Juste à titre de référence, nous prévoyons de mettre à jour le cours Data Engineer de la Linux Academy pour refléter les nouvelles orientations à partir de la mi/fin mai.

Après examen

Lorsque vous passez l’examen, vous ne recevrez qu’un résultat de réussite ou d’échec. Je conseille de viser au moins 70 %, j'ai donc visé un minimum de 90 % lors des examens pratiques.

Une fois réussi, vous recevrez un code d'échange par e-mail ainsi que votre certification officielle Google Cloud Professional Data Engineer. Toutes nos félicitations!

Vous pouvez utiliser le code d'échange dans la boutique exclusive Google Cloud Professional Data Engineer, qui regorge de cadeaux (SWAG). Il y a des T-shirts, des sacs à dos et des sweats à capuche (ils peuvent être différents de ceux en stock au moment où vous y arrivez). J'ai choisi un sweat à capuche.

Maintenant que vous êtes certifié, vous pouvez montrer vos compétences (officiellement) et recommencer à faire ce que vous faites de mieux : construire.

Rendez-vous dans deux ans pour recertifier.

PS: Si vous avez des questions ou souhaitez des éclaircissements sur quoi que ce soit, vous pouvez me trouver à Twitter и LinkedIn. sur YouTube il existe également une version vidéo de cet article.
PPS: un grand merci à tous les merveilleux professeurs de tous les cours ci-dessus et Max Kelsen pour avoir fourni des ressources et du temps pour étudier et se préparer à l’examen.

Et tous ceux qui souhaitent en savoir plus sur le programme du cours, les caractéristiques du format en ligne, les aptitudes, les compétences et les perspectives qui attendent les diplômés après la formation, nous vous invitons à Journée portes ouvertes, qui aura lieu aujourd'hui à 20.00hXNUMX.

Source: habr.com

Ajouter un commentaire