Paano Ako Nakapasa sa Google Cloud Professional Data Engineer Certification Exam

Nang walang inirerekumendang 3 taon ng praktikal na karanasan

Sa paghihintay sa pagsisimula ng kurso Data Engineer, gusto naming ibahagi sa iyo ang pagsasalin ng isang napaka-kagiliw-giliw na kuwento, na tiyak na magiging kapaki-pakinabang sa mga inhinyero ng data sa hinaharap. Go!

Paano Ako Nakapasa sa Google Cloud Professional Data Engineer Certification Exam
Google Hoodie: Nakasuot. Seryosong gumaganang ekspresyon ng mukha: kasalukuyan. Larawan mula sa bersyon ng video ng artikulong ito sa YouTube.

Tandaan. Ang artikulong ito ay tungkol sa pagsusulit sa certification ng Google Cloud Professional Data Engineer na nakatakda sa Marso 29, 2019. Pagkatapos ng petsang ito, may ilang pagbabagong naganap. Isinama ko na sila sa Extras section.

Kaya, gusto mong makakuha ng bagong hoodie tulad ng nasa cover ko? O may balak ka bang kumuha ng certificate? Google Cloud Professional Data Engineer at iniisip kung paano ito gagawin.

Sa nakalipas na ilang buwan, kumukuha ako ng mga kurso kasama ang paggamit ng Google Cloud upang maghanda para sa pagsusulit ng Professional Data Engineer. Pagkatapos ay sinubukan kong ipasa ito at pinasa. At makalipas ang ilang linggo ay dumating na ang hoodie ko. Mas mabilis dumating ang certificate.

Ililista ng artikulong ito ang ilang bagay na maaaring gusto mong malaman at ang mga hakbang na ginawa ko para maging certified bilang Google Cloud Professional Data Engineer.

Bakit mo gustong maging certified bilang Google Cloud Professional Data Engineer?

Ang data ay nasa lahat ng dako. At ang pag-alam kung paano bumuo ng mga system na maaaring magproseso at gumamit ng data ay hinihiling. Nagbibigay ang Google Cloud ng imprastraktura upang buuin ang mga system na ito.

Maaaring mayroon ka nang mga kasanayan sa paggamit ng Google Cloud, ngunit paano mo ito ipapakita sa isang employer o kliyente sa hinaharap? Mayroong dalawang paraan: portfolio ng mga proyekto o sertipikasyon.

Sinasabi ng sertipiko sa mga kliyente at employer sa hinaharap, "Mayroon akong mga kasanayan at nagsikap akong maging akreditado."

Binubuod ito ng maikling paglalarawan ng Google.

Ipakita ang iyong kakayahang magdisenyo at bumuo ng mga system sa pagpoproseso ng data, gayundin ang paggawa ng mga modelo ng machine learning sa Google Cloud Platform.

Kung wala ka pang mga kasanayan, ang pag-aaral sa mga materyales sa pagsasanay sa certification ay nangangahulugang matututuhan mo ang lahat tungkol sa kung paano bumuo ng mga world-class na data system sa Google Cloud.

Sino ang gustong maging certified bilang Google Cloud Professional Data Engineer?

Nakita mo na ang mga numero. Lumalaki ang ulap. Nandito na at wala ng patutunguhan. Kung hindi mo pa nakikita ang mga numero, maniwala ka sa akin, lumalaki ang ulap.

Kung isa ka nang data scientist, data engineer, data analyst, machine learning engineer, o naghahanap ng karera sa mundo ng data, ang Google Cloud Professional Data Engineer certification ay para sa iyo.

Ang kakayahan sa ulap ay nagiging isang kinakailangan para sa anumang posisyong nakasentro sa data.

Kailangan mo ba ng sertipiko upang maging isang mahusay na data engineer/data scientist/machine learning engineer?

Hindi.

Magagamit mo pa rin ang Google Cloud para sa mga solusyon sa data nang walang certificate.

Ang isang sertipiko ay isang paraan lamang ng pagpapatunay ng mga kasalukuyang kasanayan.

Magkano ang halaga nito?

Ang bayad sa pagsusulit ay $200. Kung mabigo ka, kailangan mong magbayad muli upang subukang muli.

Maaaring may mga gastos na nauugnay sa mga kurso sa pagsasanay at ang paggamit ng platform mismo.

Ang mga gastos sa platform ay mga bayarin para sa paggamit ng mga serbisyo ng Google Cloud. Kung ikaw ay isang sopistikadong user, alam mo na ito. Kung hindi, at nagsisimula ka pa lang sa mga tutorial sa artikulong ito, maaari kang lumikha ng bagong Google Cloud account at manatili sa loob ng $300 na alok ng Google kapag nag-sign up ka.

Makukuha natin ang halaga ng kurso sa isang segundo.

Gaano katagal ang bisa ng sertipikasyon?

2 taon. Pagkatapos nito, kakailanganin mong kumuha muli ng pagsusulit.

At dahil ang Google Cloud ay umuunlad araw-araw, malamang na kung ano ang kinakailangan para sa isang sertipiko ay magbabago (tulad ng nalaman ko, ito ay nagbago na sa oras na sinimulan kong isulat ang artikulong ito).

Ano ang kailangan mong ihanda para sa pagsusulit?

Inirerekomenda ng Google ang 3+ taon ng karanasan sa industriya at 1+ taon ng pagbuo at pamamahala ng mga solusyon gamit ang GCP para sa propesyonal na antas ng certification.

Wala akong nabanggit sa itaas.

Hindi hihigit sa 6 na buwan ng nauugnay na karanasan. Upang mabayaran ang kakulangan, gumamit ako ng kumbinasyon ng mga mapagkukunan sa online na pag-aaral.

Anong mga kurso ang kinuha ko?

Kung ikaw ay tulad ko at wala kang mga inirerekomendang kinakailangan, maaari mong kunin ang ilan sa mga sumusunod na kurso upang i-level up ang iyong mga kwalipikasyon.

Ang mga sumusunod na kurso ay ang ginamit ko upang maghanda para sa sertipikasyon. Ang mga ito ay nakalista sa pagkakasunud-sunod ng pagkumpleto.

Inilista ko ang gastos, timing, at pagiging kapaki-pakinabang ng pagkuha ng pagsusulit sa sertipikasyon para sa bawat isa.

Paano Ako Nakapasa sa Google Cloud Professional Data Engineer Certification Exam

Ang ilan sa mga mahusay na online na mapagkukunan na ginamit ko upang mapabuti ang aking mga kasanayan bago ang pagsusulit. sa pagkakasunud-sunod: Cloud Guru, Linux Academy и Coursera.

Data Engineering sa Google Cloud Platform mula sa Coursera

Gastos: $49/buwan (pagkatapos ng 7 araw na libreng pagsubok)
oras: 1–2 buwan, 10+ oras bawat linggo
Kapaki-pakinabang: 8 / 10

Data Engineering sa Google Cloud Platform mula sa Coursera ginawa sa pakikipagtulungan sa Google Cloud.

Ito ay nahahati sa limang subcourses, bawat isa ay tumatagal ng humigit-kumulang 10 oras bawat linggo ng oras ng pagtuturo.

Kung bago ka sa Google Cloud data science, dadalhin ka ng espesyalisasyong ito mula level 0 hanggang level 1. Dadaan ka sa isang serye ng mga hands-on na pagsasanay gamit ang umuulit na platform na tinatawag na QwikLabs. Bago ito, magkakaroon ng mga lecture mula sa Google Cloud practitioner kung paano gamitin ang iba't ibang serbisyo gaya ng Google BigQuery, Cloud Dataproc, Dataflow at Bigtable.

Ipinapakilala ang Cloud Guru sa Google Cloud Platform

Gastos: libre
oras: 1 linggo, 4–6 na oras
Kapaki-pakinabang: 4 / 10

Huwag kunin ang mababang marka ng pagiging kapaki-pakinabang bilang isang indikasyon na ang kurso ay hindi kapaki-pakinabang. Ito ay malayo sa totoo. Ang tanging dahilan kung bakit mas mababa ang marka nito ay dahil hindi ito nakatuon sa sertipikasyon ng Professional Data Engineer (tulad ng iminumungkahi ng pangalan).

Pagkatapos kumpletuhin ang Coursera Specialization, nakita ko ang kursong ito bilang isang refresher dahil ginamit ko lang ang Google Cloud para sa ilang espesyal na kaso ng paggamit.

Kung nanggaling ka sa ibang cloud provider o hindi ka pa nakagamit ng Google Cloud dati, maaaring gusto mong kunin ang kursong ito. Ito ay isang mahusay na panimula sa Google Cloud Platform sa pangkalahatan.

Google Certified Professional Data Engineer mula sa Linux Academy

Gastos: $49/buwan (pagkatapos ng 7 araw na libreng pagsubok)
oras: 1–4 na linggo, 4+ na oras bawat linggo
Kapaki-pakinabang: 10 / 10

Matapos makumpleto ang pagsusulit at pagnilayan ang mga kursong kinuha ko, ang higit na nakakatulong ay Google Certified Professional Data Engineer mula sa Linux Academy.

Video din E-book ng Data Dossier (isang napakahusay na libreng mapagkukunan ng pag-aaral na kasama ng kurso) at mga pagsusulit sa pagsasanay na ginawa ang kursong ito na isa sa mga pinakamahusay na mapagkukunan sa pag-aaral na nagamit ko.

Inirerekomenda ko pa ito bilang sanggunian sa ilang mga tala ng Slack sa koponan pagkatapos ng pagsusulit.

Mga Tala sa Slack

  • Ang ilang bagay sa pagsusulit ay wala sa mga pagsusulit sa alinman sa Linux Academy, Cloud Guru, o Google Cloud Practice (na inaasahan)
  • 1 tanong na may graph ng mga data point tungkol sa kung aling equation ang dapat mong pagpangkatin sa kanila (hal. cos(X) o X² + Y²)
  • Ang pag-alam sa mga pagkakaiba sa pagitan ng Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub/Sub at kung paano magagamit ang mga ito ay kinakailangan.
  • Ang dalawang gumaganang halimbawa ng mga pag-aaral sa pagsusulit ay eksaktong kapareho ng sa mga praktikal na sesyon, bagama't hindi ko binanggit ang mga pag-aaral na ito sa panahon ng pagsusulit (ang mga tanong ay nagbigay ng sapat na pag-unawa).
  • Ang kaalaman sa pangunahing SQL query syntax ay lubhang kapaki-pakinabang, lalo na para sa mga tanong sa BigQuery.
  • Ang mga pagsusulit sa pagsasanay na ibinigay ng Linux Academy at GCP ay halos kapareho ng istilo sa mga tanong sa pagsusulit, at susubukin ko ang bawat isa sa kanila nang ilang beses at gagamitin ko ang mga ito upang malaman ang iyong mga mahihinang lugar.
  • Isang maliit na tip upang makatulong sa Dataproc: “Dataproc ang croc at Hadoop plano ng elepante na Dagitab apoy at lutuin a Pugad of Pigs" {Buwaya Dataproc at elepante Hadoop nagpaplanong magsunog (Dagitab - kumislap, magpasiklab ng apoy - gumawa ng apoy) at maghanda ng isang kuyog (Pugad) baboy (Baboy)} (Nakipag-usap ang Dataproc sa Hadoop, Spark, Hive at Pig)
  • «Daloy ng data ay isang umaagos Sinag ng liwanag" {Daloy ng data ito ang kasalukuyang sinag (Sinag) light} (Dataflow deal sa Apache Beam)
  • "Lahat sa buong mundo maaaring nauugnay sa a well-made ACID wash Spanner" {Kahit sino sa buong mundo maaaring makitungo sa purified acid (ACID) na may mahusay na spanner (Spanner)} (Ang Cloud Spanner ay isang database na idinisenyo upang alisin ang ulap, sumusunod sa ACID at available sa buong mundo)
  • Maaaring kapaki-pakinabang na malaman ang mga pangalan ng mga klasikong bersyon ng relational at non-relational na mga database (halimbawa, MongoDB, Cassandra)
  • Ang mga tungkulin ng IAM ay bahagyang naiiba para sa bawat serbisyo, ngunit kapaki-pakinabang na maunawaan kung paano paghiwalayin ang mga user mula sa kakayahang makakita ng data nang hindi inaalis ang kakayahang magdisenyo ng mga daloy ng trabaho (halimbawa, ang tungkuling "Dataflow Worker" ay maaaring magdisenyo ng mga daloy ng trabaho ngunit hindi nakikita ang data )

Ito ay marahil sapat na sa ngayon. Malamang na mag-iiba-iba ang mileage sa bawat pagsusulit. Ang kursong Linux Academy ay magbibigay sa iyo ng 80% ng kaalaman.

Google Cloud 1 Minutong Video

Gastos: libre
oras: 1-2 na oras
Kapaki-pakinabang: 5 / 10

Inirerekomenda ang mga ito sa mga forum ng Cloud Guru. Marami sa kanila ay hindi nauugnay sa sertipikasyon ng Professional Data Engineer, ngunit pumili ako ng ilan na may kaugnayan.

Ang ilang mga serbisyo ay maaaring mukhang mahirap na i-navigate sa kurso, kaya masarap marinig ang isang partikular na serbisyo na inilarawan sa isang minuto.

Paghahanda para sa Cloud Professional Data Engineer Exam

Gastos: $49 bawat sertipiko o libre (walang sertipiko)
oras: 1–2 linggo, 6+ na oras bawat linggo
Kapaki-pakinabang: N / A

Natagpuan ko ang mapagkukunang ito sa araw bago ang aking pagsusulit ay naka-iskedyul. Hindi ko ito natapos dahil sa mga hadlang sa oras, kaya ang kakulangan ng rating ng pagiging kapaki-pakinabang.

Gayunpaman, batay sa page ng pangkalahatang-ideya ng kurso, mukhang isang mahusay na mapagkukunan upang pagsama-samahin ang lahat ng iyong natutunan tungkol sa Data Engineering sa Google Cloud at i-highlight ang anumang mahihinang bahagi.

Inirerekomenda ko ang kursong ito bilang mapagkukunan sa isa sa aking mga kasamahan na naghahanda para sa sertipikasyon.

Google Data Engineering Cheat Sheet ni Meverik Lin

Gastos: libre
oras: N/A
Kapaki-pakinabang: N/A

Ito ay isa pang mapagkukunan na nakita ko pagkatapos ng pagsusulit. Sa aking opinyon, ito ay komprehensibo, ngunit sa parehong oras ay maigsi. Dagdag pa, libre ito. Maaari itong magamit para sa pagbabasa sa pagitan ng mga pagsusulit sa pagsasanay o kahit na pagkatapos ng sertipikasyon upang mag-ayos ng kaalaman.

Ano ang ginawa ko pagkatapos ng kurso?

Nang malapit na akong matapos ang kurso, nag-book ako ng pagsusulit na may isang linggong paunawa.
Ang pagkakaroon ng deadline ay isang mahusay na pagganyak upang palakasin ang iyong natutunan.

Kumuha ako ng mga pagsusulit sa pagsasanay mula sa Linux Academy at Google Cloud nang maraming beses hanggang sa makumpleto ko ang mga ito nang may 95%+ na katumpakan sa bawat pagkakataon.

Paano Ako Nakapasa sa Google Cloud Professional Data Engineer Certification Exam
Nakapasa sa pagsusulit sa pagsasanay sa Linux Academy na may higit sa 90% sa unang pagkakataon.

Ang mga pagsubok mula sa bawat platform ay magkatulad, ngunit nalaman ko na ang pagdaan sa mga tanong na patuloy akong nagkakamali at isinulat kung bakit ako nagkamali sa mga ito ay nakatulong sa paghigpit sa aking mga mahihinang lugar.

Ang pagsusulit na kinuha ko ay gumamit ng dalawang halimbawang proyekto sa pananaliksik para sa pagbuo ng mga system ng data sa Google Cloud bilang paksa (nagbago ito mula noong Marso 29, 2019). At ito ay maramihang pagpipilian sa kabuuan.

Inabot ako ng halos 2 oras. At ito ay humigit-kumulang 20% ​​na mas mahirap kaysa sa alinman sa mga pagsusulit na kinuha ko.

Hindi ko maipahayag nang sapat ang halaga ng mga pagsusulit sa pagsasanay.

Ano ang aking babaguhin kung ako ay muli?

Higit pang mga pagsusulit sa pagsasanay. Higit pang praktikal na kaalaman.

Siyempre, palaging may mas maraming paghahanda na maaari mong gawin.

Kasama sa mga inirerekomendang kinakailangan ang higit sa 3 taon ng paggamit ng GCP. Ngunit wala ako, kaya kailangan kong harapin kung ano ang mayroon ako.

Bukod pa rito

Ang pagsusulit ay na-update noong Marso 29. Ang materyal na ipinakita sa artikulong ito ay nagbibigay pa rin ng isang mahusay na batayan, ngunit mahalagang tandaan ang ilang mga pagbabago.

Iba't ibang seksyon ng pagsusulit ng Google Cloud Professional Data Engineer (bersyon 1)

  1. Disenyo ng mga sistema ng pagproseso ng data
  2. Paglikha at suporta ng mga istruktura at database.
  3. Pagsusuri ng data at koneksyon sa machine learning
  4. Pagmomodelo ng proseso ng negosyo para sa pagsusuri at pag-optimize
  5. Tinitiyak ang pagiging maaasahan
  6. Visualization ng data at suporta sa patakaran
  7. Pagdidisenyo para sa Kaligtasan at Pagsunod

Iba't ibang seksyon ng pagsusulit ng Google Cloud Professional Data Engineer (bersyon 2)

  1. Disenyo ng mga sistema ng pagproseso ng data
  2. Konstruksyon at pagpapatakbo ng mga sistema ng pagproseso ng data
  3. Pagpapatakbo ng mga modelo ng machine learning (karamihan sa mga pagbabago ay nangyari dito) [BAGO]
  4. Tinitiyak ang kalidad ng mga solusyon

Pinagsama ng Bersyon 2 ang Seksyon 1, 2, 4, at 6 ng Bersyon 1 sa 1 at 2. Pinagsama rin nito ang Seksyon 5 at 7 mula Bersyon 1 sa Seksyon 4. At pinalawak ang Seksyon 3 ng Bersyon 2 upang masakop ang lahat ng bagong machine ng Google Cloud mga kakayahan sa pag-aaral.

Dahil kamakailan lamang ang mga pagbabagong ito, marami sa mga materyal sa pag-aaral ang hindi nagkaroon ng pagkakataong ma-update.

Gayunpaman, ang pagbabasa sa artikulong ito ay dapat sapat upang masakop ang 70% ng kailangan mo. Isasama ko ito sa ilan sa iyong sariling pananaliksik sa mga sumusunod na tanong (ang mga ito ay ipinakita sa ikalawang bersyon ng pagsusulit).

Gaya ng nakikita mo, ang pinakabagong update sa pagsusulit ay nakatuon sa mga kakayahan sa ML ng Google Cloud.

Update 29/04/2019: mensahe mula sa guro ng kursong Linux Academy na si Matthew Ulasein.
Para lamang sa sanggunian, pinaplano naming i-update ang kursong Data Engineer sa Linux Academy para ipakita ang mga bagong direksyon simula sa kalagitnaan/huli ng Mayo.

Pagkatapos ng pagsusulit

Kapag kumuha ka ng pagsusulit, makakatanggap ka lamang ng isang pass o fail na resulta. Pinapayuhan ko ang pagpuntirya ng hindi bababa sa 70%, kaya naglalayon ako ng pinakamababang 90% sa mga pagsusulit sa pagsasanay.

Kapag naipasa na, makakatanggap ka ng redemption code sa pamamagitan ng email kasama ng iyong opisyal na Google Cloud Professional Data Engineer certification. Binabati kita!

Magagamit mo ang redemption code sa eksklusibong Google Cloud Professional Data Engineer store, na puno ng swag (SWAG). May mga T-shirt, backpack, at hoodies (maaaring iba ang mga ito sa kung ano ang nasa stock pagdating mo doon). Pumili ako ng hoodie.

Ngayon ay certified ka na, maaari mong ipagmalaki ang iyong skillset (opisyal) at bumalik sa paggawa kung ano ang pinakamahusay na ginagawa mo, pagbuo.

Magkita-kita tayo sa loob ng dalawang taon para muling ma-certify.

PS: Kung mayroon kang anumang mga katanungan o nais ng paglilinaw sa anumang bagay, mahahanap mo ako sa kaba и LinkedIn. Sa YouTube mayroon ding bersyon ng video ng artikulong ito.
PPS: maraming salamat sa lahat ng magagaling na guro sa lahat ng mga kurso sa itaas at Max Kelsen para sa pagbibigay ng mga mapagkukunan at oras upang mag-aral at maghanda para sa pagsusulit.

At lahat ng gustong matuto nang higit pa tungkol sa programa ng kurso, mga tampok ng online na format, mga kasanayan, kakayahan at mga prospect na naghihintay sa mga nagtapos pagkatapos ng pagsasanay, inaanyayahan ka naming Bukas na Araw, na magaganap ngayon sa 20.00.

Pinagmulan: www.habr.com

Magdagdag ng komento