Decembra sÄkumÄ es pieļÄvu liktenÄ«gu kļūdu un pieÅÄmu pagrieziena punktu savÄ dzÄ«vÄ kÄ izstrÄdÄtÄjs un pÄrgÄju uz Datu inženierijas (DE) komandu uzÅÄmumÄ. Å ajÄ rakstÄ dalÄ«Å”os ar dažiem novÄrojumiem, ko izdarÄ«ju divu mÄneÅ”u laikÄ, strÄdÄjot DE komandÄ.
KÄpÄc datu inženierija?
Mans ceļojums uz DE sÄkÄs 2019. gada vasarÄ, kad mÄs
Ko Ä«sti dara mÅ«su komanda? MÄs, tÄpat kÄ visi modernie zÄni un meitenes, vÄlamies kļūt par uz datiem balstÄ«tu uzÅÄmumu. Un, lai tas bÅ«tu iespÄjams, mums ir vismaz jÄuzbÅ«vÄ uzticama krÄtuve, kuru var izmantot, lai izveidotu jebkuras uzÅÄmumam nepiecieÅ”amÄs atskaites. Bet vissvarÄ«gÄkais ir tas, ka Å”ajÄ krÄtuvÄ esoÅ”ajiem datiem ir jÄuzticas. TurklÄt, izmantojot Å”os datus, jums ir jÄspÄj atjaunot sistÄmas stÄvokli laikÄ t. To visu sarežģī fakts, ka dzÄ«vojam drosmÄ«gÄ jaunÄ mikropakalpojumu pasaulÄ, un Ŕī ideoloÄ£ija paredz, ka katrs serviss ievieÅ” savu mazo funkcionalitÄti, tÄ datu bÄze ir savs bizness, un to var izdzÄst vismaz katru dienu, bet plkst. tajÄ paÅ”Ä laikÄ mums ir jÄspÄj uztvert un apstrÄdÄt pakalpojuma stÄvokli.
Ja vÄlaties bÅ«t uz datiem balstÄ«ts, vispirms kļūstiet par uz notikumiem balstÄ«tu
Nav tik vienkÄrÅ”i. Notikumi ir dažÄdi, un izstrÄdÄtÄjs un datu inženieris uz tiem skatÄs atŔķirÄ«gi. RunÄÅ”ana par notikumiem ir atseviŔķa raksta tÄma, tÄpÄc es to Å”eit neiedziļinÄÅ”os. TurklÄt Å”Äds raksts jau ir
KopumÄ ir par ko domÄt un tÄpÄc Ŕī teritorija ir pievilcÄ«ga. TÄ nu ir sagadÄ«jies, ka mÅ«su uzÅÄmumÄ datu inženieris ir daudz plaÅ”Äka atbildÄ«bas joma, nekÄ tikai cilvÄks, kas raksta ETL/ELT konveijrus (ja nezinÄt, ko nozÄ«mÄ Å”ie saÄ«sinÄjumi, nÄciet uz
MÄs nodarbojamies ar krÄtuves arhitektÅ«ru, datu modelÄÅ”anu, ar datu droŔību saistÄ«tiem jautÄjumiem un, protams, paÅ”iem konveijeriem. Mums arÄ« jÄpÄrliecinÄs, ka, no vienas puses, mÅ«su klÄtbÅ«tne nav Ä«paÅ”i apgrÅ«tinoÅ”a produktu izstrÄdÄtÄjiem un viÅus pÄc iespÄjas mazÄk jÄnovÄrÅ” mÅ«su prasÄ«bas, ievieÅ”ot sistÄmÄ jaunas funkcijas, un, no otras puses, mÄs analÄ«tiÄ·iem un BI komandai tie ir jÄnodroÅ”ina Ärti glabÄÅ”anas datos. TÄ mÄs dzÄ«vojam.
GrÅ«tÄ«bas, pÄrejot no attÄ«stÄ«bas
SavÄ pirmajÄ darba dienÄ es saskÄros ar vairÄkÄm grÅ«tÄ«bÄm, par kurÄm vÄlos dalÄ«ties ar jums.
1. PirmÄ lieta, ko es redzÄju, bija tÅ«linga un dažu prakÅ”u trÅ«kums. Å emiet, piemÄram, koda pÄrklÄjumu ar testiem. Mums ir simtiem testÄÅ”anas sistÄmu izstrÄdes stadijÄ. StrÄdÄjot ar datiem, viss ir sarežģītÄk. JÄ, mÄs varam pÄrbaudÄ«t ETL cauruļvadus uz testa datiem, taÄu mums tas viss ir jÄdara manuÄli un jÄmeklÄ risinÄjumi katram konkrÄtajam gadÄ«jumam. TÄ rezultÄtÄ testa pÄrklÄjums ir daudz sliktÄks. Par laimi, ir vÄl viens atgriezeniskÄs saites slÄnis monitoringa un žurnÄlu veidÄ, taÄu tas jau liek mums reaÄ£Ät, nevis proaktÄ«vi, kas ir saÅ”utis un satraucoÅ”i.
2. Pasaule no DE perspektÄ«vas nepavisam nav tÄda, kÄ liekas parastam produktu izstrÄdÄtÄjam (nu protams lasÄ«tÄjs nav tÄds, un viÅÅ” jau visu zina, bet es nezinÄju un tagad skraidos to uz augÅ”u). KÄ izstrÄdÄtÄjs es izveidoju pats savu mikropakalpojumu, ievietoju datus [datubÄzÄ pÄc jÅ«su izvÄles], saglabÄju savu stÄvokli, iegÅ«stu kaut ko ar ID, un viss ir kÄrtÄ«bÄ. Pakalpojums ir lÄns, pasÅ«tÄ«jumi ir mulsinoÅ”i, tas arÄ« viss. ViÅi lÅ«dz man meklÄt savu stÄvokli citÄ pakalpojumÄ, tÄpÄc es iemetÄ«Å”u notikumu kÄdÄ RabbitMQ, un viss. Un Å”eit mÄs atkal atgriezÄmies pie iepriekÅ” aprakstÄ«to notikumu jautÄjuma.
Tas, kas dienestam nepiecieÅ”ams operatÄ«vajam darbam, mums neder vÄsturiskajiem datiem, tÄpÄc sÄkas jautÄjums par pakalpojumu lÄ«gumu pÄrstrÄdi un cieÅ”u darbu ar izstrÄdes komandÄm. JÅ«s pat nevarat iedomÄties, cik stundas mums vajadzÄja, lai vienotos: kÄds notikumiem viÅÅ” ir mÅ«su uzÅÄmumÄ.
3. JÄdomÄ ar galvu. NÄ, es nedomÄju, ka izstrÄdÄtÄji nedomÄ (lai gan kas es esmu, lai runÄtu par visiem), vienkÄrÅ”i produktu izstrÄdÄ Ä¼oti bieži jums jau ir sava veida arhitektÅ«ra, un jÅ«s izgriežat dažÄdus sajaukumus no atpalicÄ«bas. Protams, tas prasa plÄnoÅ”anu un pÄrdomÄÅ”anu, bet tas ir plÅ«smas darbs, kur galvenÄ problÄma ir vienkÄrÅ”i to izdarÄ«t labi un efektÄ«vi.
Mums tas nav tik vienkÄrÅ”i, jo dažÄdu sistÄmas komponentu pÄrneÅ”ana no silta un mÄjÄ«ga monolÄ«ta savvaļas mikropakalpojumu džungļu pasaulÄ nav tik vienkÄrÅ”a. Kad pakalpojums sÄk izmest notikumus, jums ir jÄpÄrskata krÄtuves aizpildÄ«Å”anas loÄ£ika, jo dati tagad izskatÄs citÄdi. Å eit ir jÄdomÄ daudz un pamatÄ«gi, ne vairs kÄ izstrÄdÄtÄjam, bet gan kÄ datu inženierim. Tas ir parasts stÄsts, kad jÅ«s pavadÄt dienas ar piezÄ«mju grÄmatiÅu un pildspalvu vai marÄ·ieri pie tÄfeles. Tas ir ļoti grÅ«ti, man nepatÄ«k domÄt, man arÄ« patÄ«k producÄÅ”ana.
4. VarbÅ«t vissvarÄ«gÄkÄ lieta ir informÄcija. Ko mÄs darÄm, kad mums trÅ«kst zinÄÅ”anu? KurÅ” teica stackoverflow? Izvediet Å”o cilvÄku no istabas. MÄs ejam lasÄ«t dokumentus, grÄmatas par Å”o tÄmu, un ir arÄ« kopiena, kas organizÄ forumus, tikÅ”anÄs un konferences. DokumentÄcija ir lieliska, taÄu diemžÄl tÄ var bÅ«t nepilnÄ«ga. MÄs izmantojam Cosmos DB vairÄkos projektos. Veiksmi, lasot Ŕī produkta dokumentÄciju. GrÄmatas ir vienÄ«gais glÄbiÅÅ”, par laimi, tÄs pastÄv un ir atrodamas, tajÄs ir daudz fundamentÄlu zinÄÅ”anu un jÄlasa daudz un pastÄvÄ«gi. Bet problÄma ir sabiedrÄ«bÄ.
Tagad mÅ«su reÄ£ionÄ ir grÅ«ti atrast vismaz vienu atbilstoÅ”u konferenci vai tikÅ”anos. NÄ, protams, ir daudz tikÅ”anÄs ar vÄrdu Data, taÄu blakus Å”im vÄrdam parasti ir dÄ«vaini saÄ«sinÄjumi, piemÄram, ML vai AI. TÄtad, tas nav priekÅ” mums, mÄs runÄjam par to, kÄ bÅ«vÄt noliktavas, nevis kÄ iesmÄrÄt sevi ar neironiem. Å ie hipsteri ir pÄrÅÄmuÅ”i visu. RezultÄtÄ mÄs esam bez kopienas. Starp citu, ja esat datu inženieris un zinÄt labas kopienas, lÅ«dzu, rakstiet komentÄros.
SecinÄjumi un paziÅojums par tikÅ”anos
Ar ko mÄs nonÄkam? Mana pirmÄ pieredze liecina, ka iejusties datu inženiera ÄdÄ noderÄs ikvienam izstrÄdÄtÄjam. Tas tikai ļauj mums paskatÄ«ties uz lietÄm savÄdÄk un nebÅ«t pÄrsteigtiem, kad mÅ«su acis kļūst asiÅainas, redzot, kÄ izstrÄdÄtÄji apstrÄdÄ savus datus. TÄtad, ja jÅ«su uzÅÄmumÄ ir DE, vienkÄrÅ”i runÄjiet ar Å”iem puiÅ”iem, jÅ«s uzzinÄsit daudz jaunu lietu (par sevi).
Un visbeidzot paziÅojums. TÄ kÄ dienas laikÄ ir grÅ«ti atrast tikÅ”anÄs par mÅ«su tÄmu, mÄs nolÄmÄm izveidot paÅ”i. KÄpÄc mÄs esam sliktÄki? Par laimi mums ir pÄrsteidzoÅ”s
Izmantojot Å”o iespÄju, aicinu ikvienu, kam interesÄ, ierasties uz mÅ«su pirmo kopienas tikÅ”anos ar daudzsoloÅ”o nosaukumu āDE vai DIEā, kas notiks 27.02.2020. gada XNUMX. februÄrÄ« Dodo Pizza birojÄ. SÄ«kÄka informÄcija plkst
Ja kaut kas notiks, es bÅ«Å”u klÄt, jÅ«s varat man personÄ«gi pateikt, cik es kļūdos attiecÄ«bÄ uz izstrÄdÄtÄjiem.
Avots: www.habr.com