Dulmarka Hababka Naqshad ee Agile DWH

Horumarinta goob wax lagu kaydiyo waa hawl dheer oo halis ah.

Inta badan nolosha mashruucu waxay kuxirantahay sida wanaagsan ee qaabka shayga iyo qaab dhismeedka saldhiga looga fikirayo bilowga.

Habka guud ee la aqbalay ayaa ahaa oo weli ah noocyo kala duwan oo isku darka nidaamka xiddigaha iyo qaabka caadiga ah ee saddexaad. Sida caadiga ah, sida waafaqsan mabda'a: xogta bilowga ah - 3NF, bandhigyo - xiddig. Habkan, waqtiga la tijaabiyay oo lagu taageeray tiro badan oo cilmi baaris ah, waa kan ugu horreeya (iyo mararka qaarkood kaliya) shay ku soo dhaca maskaxda khabiir khibrad leh oo DWH ah marka uu ka fekerayo sida kaydka falanqaynta uu u ekaado.

Dhanka kale, ganacsiga guud ahaan iyo shuruudaha macaamiisha gaar ahaan waxay u muuqdaan inay si dhakhso ah isu beddelaan, xogtuna waxay u egtahay inay koraan "si qoto dheer" iyo "ballaaran". Oo tani waa meesha ay faa'iido darrada ugu weyn ee xiddigtu u muuqato - xaddidan dabacsanaan.

Oo haddii aad ku jirto noloshaada xasilloon iyo raaxada leh sida horumariyaha DWH si lama filaan ah:

  • hawshu waxay kacday "in la sameeyo ugu yaraan wax degdeg ah, ka dibna waan arki doonaa";
  • Mashruuc si degdeg ah u kobcaya ayaa soo muuqday, oo leh isku xirka ilo cusub iyo dib u habeynta qaabka ganacsiga ugu yaraan hal mar toddobaadkii;
  • macaamiil ayaa soo muuqday oo aan wax fikrad ah ka haysan nidaamka uu u ekaan karo iyo shaqooyinka ay tahay inuu ugu dambeyntii qabto, laakiin wuxuu diyaar u yahay inuu tijaabiyo oo si joogto ah u nadiifiyo natiijada la rabo isagoo si joogta ah ugu soo dhowaanaya;
  • Maamulaha mashruuca ayaa la yimid warka wanaagsan: "Imikana waxaan helnay firfircooni!"

Ama haddii aad xiisaynayso inaad ogaato sida kale ee aad u dhisi karto tas-hiilaadka kaydinta - ku soo dhawoow goynta!

Dulmarka Hababka Naqshad ee Agile DWH

Waa maxay macnaha "debacsanaan"?

Marka hore, aynu qeexno waxa ay tahay in nidaamku yeesho si loogu yeedho β€œ dabacsanaan leh”.

Si gooni ah, waxaa habboon in la sheego in guryaha lagu sharraxay ay tahay inay si gaar ah ula xiriiraan nidaamka, ma aha in habka horumarkeeda. Sidaa darteed, haddii aad rabto inaad wax ka akhrido Agile sida habka horumarinta, waxaa fiican inaad akhrido maqaallo kale. Tusaale ahaan, halkaas, HabrΓ©, waxaa jira waxyaabo badan oo xiiso leh (sida dib u eegis ΠΈ wax ku ool ah, iyo dhibaato leh).

Tani macnaheedu maaha in geeddi-socodka horumarinta iyo qaab-dhismeedka bakhaarka xogtu aanay gebi ahaanba xidhiidh la lahayn. Guud ahaan, waa inay si aad ah u sahlanaato in la horumariyo kaydka Agile ee qaab dhismeedka agile. Si kastaba ha noqotee, ficil ahaan, inta badan waxaa jira xulashooyin leh horumarinta Agile ee DWH-ga caadiga ah marka loo eego Kimbal iyo DataVault - marka loo eego Waterfall, marka loo eego dhacdooyinka farxadda leh ee dabacsanaanta labada qaab ee hal mashruuc.

Haddaba, waa maxay awoodaha ay tahay in kaydinta dabacsani ay yeelato? Halkan waxaa ah saddex qodob:

  1. Dhalmada hore iyo soo celinta degdega ah - tani waxay ka dhigan tahay in natiijada ugu horreysa ee ganacsiga (tusaale ahaan, warbixinnada shaqada ee ugu horreeya) waa in la helaa sida ugu dhaqsaha badan ee suurtogalka ah, taas oo ah, xitaa ka hor inta aan nidaamka oo dhan si buuxda loo nashqadeynin oo la hirgelin. Intaa waxaa dheer, dib-u-eegid kasta oo soo socota waa inay sidoo kale qaadato waqti yar intii suurtagal ah.
  2. Sifaynta isku dhafka ah -Tani waxay ka dhigan tahay in horumar kasta oo soo socdaa aanu saamayn ku yeelan hawl-qabadka horeba u shaqaynayay. Waa wakhtigan oo inta badan noqda riyooyinka ugu weyn ee mashaariicda waaweyn - si degdeg ah ama ka dib, walxaha shakhsi ahaaneed waxay bilaabaan inay helaan xiriiro badan oo ay u sahlanaato in si buuxda loogu celiyo macquulka nuqulka u dhow halkii lagu dari lahaa miis jira. Oo haddii aad la yaabto in falanqaynta saamaynta hagaajinta ee walxaha jira ay qaadan karto wakhti ka badan hagaajinta laftooda, waxay u badan tahay inaadan wali la shaqayn kaydka xogta waaweyn ee bangiyada ama isgaadhsiinta.
  3. Si joogto ah ula qabsiga isbeddelka shuruudaha ganacsiga - qaabka guud ee shayga waa in loo qaabeeyaa ma aha oo kaliya in la tixgeliyo ballaarinta suurtagalka ah, laakiin iyada oo la filayo in jihada ballaarinta soo socota aan xitaa lagu riyoon karin marxaladda naqshadeynta.

Oo haa, buuxinta dhammaan shuruudahan hal nidaam ayaa suurtagal ah (dabcan, xaaladaha qaarkood iyo qaar boos celin ah).

Hoos waxaan tixgelin doonaa laba ka mid ah hababka naqshadaynta agile ee ugu caansan bakhaarrada xogta - Qaabka barroosinka ΠΈ Kaydka Xogta. Marka laga tago xayndaabyada ayaa ah farsamooyin aad u fiican sida, tusaale ahaan, EAV, 6NF (qaabkeeda saafiga ah) iyo wax kasta oo la xidhiidha xalalka NoSQL - ma aha sababtoo ah waxay ka sii xun yihiin, xitaa sababtoo ah kiiskan maqaalku wuxuu ku hanjabayaa inuu helo mugga celceliska disserr. Kaliya waxaas oo dhami waxay la xiriiraan xalalka fasal wax yar ka duwan - ama farsamooyinka aad u isticmaali karto xaalado gaar ah, iyadoon loo eegin dhismaha guud ee mashruucaaga (sida EAV), ama jaantusyada kale ee macluumaadka ee caalamiga ah (sida xogta garaafyada iyo fursadaha kale ee NoSQL).

Dhibaatooyinka habka "classical" iyo xalalkooda hababka dabacsan

Habka "classical" waxaan ula jeedaa xiddigii hore ee wanaagsan (iyadoon loo eegin hirgelinta gaarka ah ee lakabyada hoose, taageerayaasha Kimball, Inmon iyo CDM ha i cafiyaan).

1. Xidhiidhiyayaasha adag

Qaabkani waxa uu ku salaysan yahay qaybinta cad ee xogta Cabirka ΠΈ xaqiiqooyinka. Oo tan, naclad, waa macquul - ka dib oo dhan, falanqaynta xogta ee kiisaska intooda badan waxay hoos ugu dhacdaa falanqaynta tilmaamayaasha tirooyinka qaarkood (xaqiiqda) qaybo gaar ah (cabbir).

Xaaladdan oo kale, xiriirka ka dhexeeya walxaha waxaa lagu aasaasay qaabka xiriirka u dhexeeya miisaska iyadoo la adeegsanayo furaha shisheeye. Tani waxay u egtahay mid dabiici ah, laakiin isla markiiba waxay keenaysaa xaddidaadda ugu horreysa ee dabacsanaanta - qeexid adag oo ah kadinnimada xidhiidhada.

Tani waxay ka dhigan tahay in marxaladda naqshadeynta miiska, waa inaad si sax ah u go'aamisaa lamaane kasta oo la xidhiidha shay kasta oo la xidhiidha inay la xiriiri karaan inta badan-ilaa-badan, ama kaliya 1-ilaa-badan, iyo "jihadahee". Tani waxay si toos ah u go'aaminaysaa shaxda yeelan doona furaha aasaasiga ah iyo kan yeelan doona furaha shisheeye. Beddelidda hab-dhaqankan marka shuruudo cusub la helo waxay u badan tahay inay horseeddo dib-u-shaqayn lagu sameeyo saldhigga.

Tusaale ahaan, markaad naqshadaynayso shayga "rasiidhka kaashka", adiga, adoo ku tiirsan dhaarta waaxda iibka, waxaad dejisay suurtagalnimada ficil hal dallacsiin dhowr boos oo hubin ah (laakin caksigeeda maaha):

Dulmarka Hababka Naqshad ee Agile DWH
Muddo ka dib, asxaabtu waxay soo bandhigeen istaraatiijiyad suuq-geyneed oo cusub oo ay ku dhaqmi karaan isla mowqif isku mid ah dhowr dallacsiin isku mar. Oo hadda waxaad u baahan tahay inaad wax ka beddesho miisaska adigoo kala saaraya xiriirka shay gaar ah.

(Dhammaan walxaha la soo saaray ee jeegga xayaysiinta lagu soo daray hadda sidoo kale waxay u baahan yihiin in la hagaajiyo).

Dulmarka Hababka Naqshad ee Agile DWH
Xidhiidhada ku jira Kaydka Xogta iyo Modelka barroosinka

Ka fogaanshaha xaaladdan waxay noqotay mid fudud: uma baahnid inaad ku kalsoonaato waaxda iibka inay tan sameyso. dhammaan isku xirka marka hore waxaa lagu kaydiyaa miisas kala duwan una habeeyaan sida badan-ilaa-badan.

Habkan ayaa la soo jeediyay Dan Linstedt sida qayb ka mid ah jaantuska Kaydka Xogta si buuxdana loo taageeray Lars RΓΆnnbΓ€ck Π² Qaabka Barroosinka.

Natiijo ahaan, waxaan helnaa sifada ugu horeysa ee gaarka ah ee hababka dabacsan:

Xidhiidhka ka dhexeeya shay kuma kaydsana sifada hay'adaha waalidka, laakiin waa shay gaar ah.

Π’ Kaydka Xogta miisaska isku xirka noocan oo kale ah ayaa loo yaqaan Link, halka Qaabka Barroosinka - Tie. Jaleecada hore, aad bay isugu shabahaan, in kasta oo khilaafkoodu aanu ku dhammaanayn magaca (kaas oo hoos lagaga hadli doono). Labada qaab-dhismeedka, miisaska isku xirka ayaa isku xiri kara tiro kasta oo hay'ado ah (ma aha qasab 2).

Dib-u-celintan, jaleecada hore, waxay siinaysaa dabacsanaan weyn oo wax ka beddel ah. Qaab dhismeedka noocan oo kale ah wuxuu noqonayaa mid dulqaad leh oo keliya maaha in isbeddelka ku yimaadda xiriirka hadda jira, laakiin sidoo kale lagu daro kuwa cusub - haddii hadda booska jeeggu sidoo kale wuxuu leeyahay xiriir la leh khasnajiga kaas oo jabiyay, muuqaalka xiriirka noocan oo kale ah ayaa si fudud u noqon doona. noqo wax-ku-kordhinta miisaska jira adiga oo aan wax saamayn ah ku yeelan shay iyo habraacyo jira.

Dulmarka Hababka Naqshad ee Agile DWH

2. Xog ku duubid

Dhibaatada labaad ee lagu xalliyo qaab-dhismeedka dabacsan ayaa ah mid aan si cad u muuqan oo waa mid asal ah marka hore. cabbirrada nooca SCD2 (si tartiib ah u beddela cabbirrada nooca labaad), in kasta oo aan iyaga oo keliya ahayn.

Bakhaarka caadiga ah, cabbirku caadi ahaan waa miis ka kooban furaha beddelka (PK ahaan) iyo furayaal ganacsi iyo astaamo kala duwan.

Dulmarka Hababka Naqshad ee Agile DWH

Haddii cabbirku uu taageero nuqul ka mid ah, xuduudaha ansaxnimada nooca waxaa lagu daraa jaangooyooyinka caadiga ah ee goobaha, iyo hal saf oo isha ah, dhowr nooc ayaa ka soo muuqanaya kaydka (mid ka mid ah isbeddel kasta oo ku yimaadda sifooyinka la daabacay).

Haddii cabbirku ka kooban yahay ugu yaraan hal sifo oo si joogta ah loo beddelo, tirada noocyada cabbirka noocan oo kale ah waxay noqon doontaa mid cajiib ah (xitaa haddii sifooyinka soo hadhay aan la daabacin ama aan waligood isbeddelin), iyo haddii ay jiraan dhowr astaamood oo noocaas ah, tirada noocyada ayaa noqon karta si xad dhaaf ah uga koraan tiradooda. Cabirkani wuxuu qaadan karaa xaddi weyn oo disk ah, in kasta oo inta badan xogta ay kaydiso ay tahay nuqul ka mid ah qiyamka sifaha aan la beddeli karin ee safafka kale.

Dulmarka Hababka Naqshad ee Agile DWH

Isla mar ahaantaana, sidoo kale waxaa badanaa la isticmaalaa caadi ka dhigid - sifooyinka qaar ayaa si ula kac ah loogu kaydiyaa qiime ahaan, ee maaha sida isku xidhka buug tixraac ama cabbir kale. Habkani wuxuu dedejiyaa helitaanka xogta, yaraynta tirada ku biirista marka la gelayo cabbirka.

Caadi ahaan tani waxay keenaysaa xog isku mid ah ayaa isku mar lagu kaydiyaa dhowr meelood. Tusaale ahaan, macluumaadka ku saabsan gobolka la deggan yahay iyo qaybta macmiilka waxaa isla mar lagu kaydin karaa cabbirrada "Client" iyo "Iibka", "Gaynta" iyo "Xarunta Wicitaanada" xaqiiqooyinka, iyo sidoo kale "Client - Manager Client". ” miiska isku xirka.

Guud ahaan, kuwan kor ku xusan waxay khuseeyaan cabbirrada caadiga ah (aan-nooc-nooc), laakiin kuwa la soo koobay waxay yeelan karaan miisaan kala duwan: muuqaalka nooc cusub oo shay ah (gaar ahaan dib-u-eegis) waxay keenaysaa ma aha oo kaliya cusboonaysiinta dhammaan kuwa la xiriira. miisaska, laakiin si muuqaalka cascading ee versions cusub ee walxaha la xiriira - marka Shaxda 1 loo isticmaalo in lagu dhiso Shaxda 2, iyo Shaxda 2 loo isticmaalo in lagu dhiso Shaxda 3, iwm. Xataa haddii aan hal sifo oo Shaxda 1 ahi ku lug lahayn dhismaha Shaxda 3 (iyo sifooyin kale oo Shaxda 2 laga helay ilo kale ayaa ku lug leh), qaabaynta dhismahani waxa uu ugu yaraan horseedi doonaa kharash dheeraad ah, iyo ugu badnaan ilaa dheeraad ah. versions ee Shaxda 3. taas oo aan waxba ku lahayn in ay dhan, iyo hoos u sii silsiladda.

Dulmarka Hababka Naqshad ee Agile DWH

3. Kakanaanta aan tooska ahayn ee dib-u-shaqaynta

Isla mar ahaantaana, bakhaar kasta oo cusub oo lagu dhisay mid kale wuxuu kordhiyaa tirada meelaha ay xogtu "kala duwanaan karto" marka isbedel lagu sameeyo ETL. Tani, markeeda, waxay keenaysaa korodhka kakanaanta (iyo muddada) ee dib-u-eegis kasta oo xiga.

Haddii kuwa kor ku xusan ay qeexayaan nidaamyada leh hababka ETL ee dhif ah, waxaad ku noolaan kartaa jaantuska noocaas ah - kaliya waxaad u baahan tahay inaad hubiso in wax ka beddel cusub si sax ah loogu sameeyay dhammaan walxaha la xiriira. Haddii dib-u-eegiddu ay si joogto ah u dhacdo, suurtogalnimada in si lama filaan ah ay u "la'aan" dhowr xiriir ayaa si weyn u kordheysa.

Haddii, marka lagu daro, aan xisaabta ku darno in "nooca" ETL uu si aad ah uga dhib badan yahay "mid aan nooca lahayn", waxay noqoneysaa mid aad u adag in laga fogaado khaladaadka marka si joogta ah loo cusbooneysiiyo xaruntan oo dhan.

Ku kaydinta walxaha iyo sifooyinka ku jira Vault Data iyo Model Anchor

Habka ay soo jeediyaan qorayaasha naqshadaha dabacsan waxaa loo dejin karaa sida soo socota:

Waa lagama maarmaan in la kala saaro waxa isbeddelaya iyo waxa soo hadhay. Taasi waa, kaydinta furayaasha si ka duwan sifooyinka.

Si kastaba ha ahaatee, waa in aan la jahawareerin aan la daabacin sifo leh isma beddelin: midda hore ma kaydiso taariikhda isbeddelkeeda, laakiin way beddeli kartaa (tusaale ahaan, marka la saxayo qaladka gelinta ama la helayo xog cusub); ta labaad marna isma beddesho.

Fikradaha aragtidu waxay ku kala duwan yihiin waxa dhabta ah ee loo tixgelin karo inaan la bedeli karin ee Kaydka Xogta iyo Modelka barroosinka.

Marka laga eego dhinaca dhismaha Kaydka Xogta, waxaa loo qaadan karaa inaan isbedelin dhammaan furayaasha - dabiici ah (TIN ee ururka, code koodka ee nidaamka isha, iwm) iyo beddelka. Xaaladdan oo kale, sifooyinka haray waxaa loo qaybin karaa kooxo iyadoo loo eegayo isha iyo/ama inta jeer ee isbeddelada iyo U ilaali miis gaar ah koox kasta oo leh noocyo kala duwan oo madax-bannaan.

In tusmada Qaabka Barroosinka loo arko in aan isbeddelin kaliya furaha beddelka nuxurka. Wax kasta oo kale (oo ay ku jiraan furayaasha dabiiciga ah) waa kiis gaar ah oo ka mid ah sifooyinka. Halkaa sifada oo dhami way ka madax banaan yihiin midba midka kale marka la eego, sidaas darteed sifo kasta a miiska goonida ah.

Π’ Kaydka Xogta miisaska ay ku jiraan furaha cidda ayaa loo yaqaan Hubami. Hubku had iyo jeer waxay ka kooban yihiin goobo go'an:

  • Furayaasha Dabiiciga ah
  • Furaha beddelka
  • Xidhiidhka isha
  • Diiwaangeli wakhtiga ku darista

Qoraalada ku jira Hubs waligaa isma bedelin oo ma laha nuqullo. Dibadda, hub-yadu waxay aad ugu eg yihiin jaantusyada nooca-maabka aqoonsiga ee loo isticmaalo nidaamyada qaarkood si ay u soo saaraan beddelka, si kastaba ha ahaatee, waxaa lagu talinayaa in la isticmaalo xashiish ka mid ah furayaasha ganacsiga sida beddelka xogta Vault. Habkani waxa uu fududeeyaa xidhiidhada rarista iyo sifooyinka ilaha (looma baahna in lagu biiro xuddunta si loo helo beddelka, kaliya xisaabi xashiishka furaha dabiiciga ah), laakiin waxay keeni kartaa dhibaatooyin kale (tusaale ahaan, shilalka, kiis iyo kuwa aan la daabicin karin). jilayaasha furayaasha xargaha, iwm. .p.), sidaa darteed guud ahaan lama aqbalin.

Dhammaan sifooyinka kale waxay ku kaydsan yihiin jadwal gaar ah oo loo yaqaan Satellites. Hal xarun ayaa yeelan karta dhowr satalayt oo kaydiya sifooyin kala duwan.

Dulmarka Hababka Naqshad ee Agile DWH

Qaybinta sifooyinka satalaytka waxay u dhacdaa si waafaqsan mabda'a isbedel wadajir ah - mid ka mid ah dayax-gacmeedka aan nooca lahayn ayaa lagu kaydin karaa (tusaale ahaan, taariikhda dhalashada iyo SNILS ee shakhsi ahaaneed), mid kale - marar dhif ah ayaa isbeddelaya kuwa la daabacay (tusaale, magaca dambe iyo lambarka baasaboorka), ta saddexaad - kuwa si joogta ah u beddela (tusaale ahaan, ciwaanka geynta, qaybta, taariikhda dalabka u dambeeyay, iwm.). Xaaladdan oo kale, versioning waxaa lagu fuliyaa heerka dayax-gacmeedka shakhsi, oo ma aha hay'adda guud ahaan, sidaas darteed waxaa lagu talinayaa in la qaybiyo sifooyinka si isgoyska versions gudahood hal dayax-gacmeed waa ugu yar (taas oo hoos u dhigaysa tirada guud ee versions kaydsan. ).

Sidoo kale, si loo wanaajiyo habka rarista xogta, sifooyinka laga helay ilo kala duwan ayaa inta badan lagu daraa dayax-gacmeedka shakhsi ahaaneed.

Satellite-ku waxa ay kula xidhiidhaan Hubka furaha shisheeye (taas oo u dhiganta 1-ilaa-badana wadnaha). Tani waxay ka dhigan tahay in qiyamka sifada badan (tusaale, lambaro telefoon oo badan oo lagala xiriiro hal macmiil) ay taageerayaan qaab dhismeedkan "default".

Π’ Qaabka Barroosinka miisaska kaydiya furayaasha ayaa loo yaqaan Barroosinno. Waxayna ilaalinayaan:

  • Keliya furayaasha beddelka
  • Xidhiidhka isha
  • Diiwaangeli wakhtiga ku darista

Furayaasha dabiiciga ah marka laga eego dhinaca aragtida Modelka barroosinka ayaa la tixgeliyaa sifooyinka caadiga ah. Doorashadani waxay u ekaan kartaa mid aad u adag in la fahmo, laakiin waxay siinaysaa baaxad aad u badan oo lagu aqoonsan karo shayga.

Dulmarka Hababka Naqshad ee Agile DWH

Tusaale ahaan, haddii xogta ku saabsan isla hay'ad ka iman karto nidaamyo kala duwan, kuwaas oo mid kastaa isticmaalo furihiisa dabiiciga ah. In Data Vault, tani waxay u horseedi kartaa dhismayaal dhib badan oo dhowr xarumood ah (mid kasta + nooc mideeya), halka qaabka Anchor, furaha dabiiciga ah ee il kastaa uu ku dhaco sifo u gaar ah waxaana loo isticmaali karaa marka si madax banaan loo shubayo kuwa kale oo dhan.

Laakiin waxaa sidoo kale jira hal qodob oo qarsoodi ah halkan: haddii sifooyin ka yimid nidaamyo kala duwan lagu daro hal qayb, waxay u badan tahay inay jiraan qaar. xeerarka "gluing", kaas oo nidaamku ku qasban yahay inuu fahmo in diiwaannada laga helay ilo kala duwan ay u dhigmaan hal tusaale oo ka mid ah hay'adda.

Π’ Kaydka Xogta Xeerarkani waxay u badan tahay inay go'aamin doonaan samaynta "xarunta beddelka" ee hay'adda sayid oo aan sinaba saamayn ugu yeelan Hubs-yada kaydiya furayaasha ilaha dabiiciga ah iyo sifooyinkooda asalka ah. Haddi mar ay isbedesho qawaaniinta isku darka (ama sifooyinkii lagu sameeyay la cusboonaysiiyay), way ku filnaan doontaa in dib loo habeeyo xarumaha ku meel gaadhka ah.

Π’ Qaabka barroosinka ciddan oo kale waxay u badan tahay in lagu kaydin doono barroosinka kaliya. Taas macneheedu waxa weeye in dhammaan sifooyinku, isha ay doonaan ha ka yimaadeene, waxay ku xidhnaan doonaan hal-door isku mid ah. Kala saarida diiwaannada sida khaldan loo mideeyay iyo, guud ahaan, la socodka ku-habboonaanta nidaamkan oo kale aad ayey u adkaan kartaa, gaar ahaan haddii xeerarku aad u adag yihiin oo marar badan isbeddelaan, isla markaana sifo la mid ah laga heli karo ilo kala duwan (in kasta oo ay hubaal tahay. suurtagal, maadaama mid kasta nooca sifadu uu sii hayo xidhiidhka isha).

Si kastaba ha noqotee, haddii nidaamkaagu u malaynayo inuu hirgeliyo shaqeynta kala-saarid, diiwaanada isku-darka iyo walxaha kale ee MDM, waxaa habboon in fiiro gaar ah loo yeesho dhinacyada kaydinta furayaasha dabiiciga ah ee hababka agile. Waxay u badan tahay in naqshada Vault Data aadka u weyn uu si lama filaan ah u noqon doono mid ka badbaado badan marka la eego khaladaadka isku darka.

Qaabka barroosinka sidoo kale waxay bixisaa nooc shay oo dheeraad ah oo la yiraahdo guntin asal ahaan waa gaar nooca barroosinka xumaaday, kaas oo ka koobnaan kara hal sifo. Noodhyada waa in lagu kaydiyaa hagaha fidsan (tusaale ahaan, jinsiga, xaaladda guurka, qaybta adeegga macaamiisha, iwm.). Si ka duwan Barroosinka, guntida ma laha jaantusyo sifo la xidhiidha, iyo sifadeeda kaliya (magaca) had iyo jeer waxaa lagu kaydiyaa isla miiska furaha. Nodes waxay ku xidhan yihiin barroosinnada iyadoo loo eegayo miisaska tie (Tie) si la mid ah sida barroosinadu isugu xidhan yihiin.

Ma jiro fikrad cad oo ku saabsan isticmaalka Nodes. Tusaale ahaan, Nikolay Golov, kuwaas oo si firfircoon u dhiirrigeliya isticmaalka Modelka Anchor ee Ruushka, waxay aaminsan yihiin (maaha wax aan macquul ahayn) in aan hal buug tixraac ah la odhan karin si hubaal ah. had iyo jeer waxay noqon doontaa mid taagan oo hal-heer ah, markaa waxa fiican in isla markiiba loo isticmaalo Barroosin dhamaystiran dhammaan walxaha.

Farqi kale oo muhiim ah oo u dhexeeya Data Vault iyo model Anchor waa helitaanka sifooyinka isku xirka:

Π’ Kaydka Xogta Xidhiidhku waa shay buuxa oo la mid ah Hubs, waana yeelan karaan sifooyinka gaarka ah. The Qaabka barroosinka Xidhiidhada waxa loo isticmaalaa oo kaliya in lagu xidho barroosinada iyo ma yeelan karaan sifooyin u gaar ah. Farqigani waxa uu keenayaa habab qaabaynta oo aad u kala duwan xaqiiqooyinka, kaas oo laga wada hadli doono.

Kaydinta Xaqiiqda

Intan ka hor, waxaan inta badan ka hadalnay qaabaynta cabbirka. Xaqiiqadu way yara caddahay.

Π’ Kaydka Xogta shay caadi ah oo lagu kaydiyo xaqiiqooyinka waa Xiriirinta, kuwaas oo dayax-gacmeedkooda lagu daray tilmaamayaasha dhabta ah.

Habkani wuxuu u muuqdaa mid dareen leh. Waxay si sahal ah u gelisaa tilmaamayaasha la falanqeeyay waxayna guud ahaan la mid tahay miis xaqiiqo dhaqameed (kaliya tilmaamayaasha ayaa lagu kaydin miisaska laftiisa, laakiin shaxda β€œderiska”). Laakiin sidoo kale waxaa jira cillado: mid ka mid ah wax ka beddelka caadiga ah ee qaabka - ballaarinta furaha dhabta ah - waxay u baahan tahay ku darista fure cusub oo ajnabi ah Link. Oo tan, markeeda, "jebinaysa" modularity-ka waxayna suurtogal u tahay baahida loo qabo wax ka beddelka walxaha kale.

Π’ Qaabka barroosinka Xidhiidhku ma yeelan karo sifooyin u gaar ah, markaa habkani ma shaqayn doono - gabi ahaanba dhammaan sifooyinka iyo tilmaamayaasha waa in lagu xidhaa hal barroosin oo gaar ah. Gabagabadii tani waa mid fudud - Xaqiiq kasta waxay sidoo kale u baahan tahay barroosinkeeda. Qaar ka mid ah waxa aan u isticmaalnay in aan u aragno xaqiiqo ahaan, tani waxay u ekaan kartaa mid dabiici ah - tusaale ahaan, xaqiiqda wax iibsiga si fiican ayaa loo dhimi karaa shayga "dalabka" ama "rasiidhka", booqashada goobta fadhiga, iwm. Laakiin sidoo kale waxaa jira xaqiiqooyin kuwaas oo aan si fudud loo helin "shay side" dabiiciga ah - tusaale ahaan, hadhaagii alaabta bakhaarada bilawga maalin kasta.

Sidaa darteed, dhibaatooyinka ku jira qaab-dhismeedka marka la ballaarinayo furaha dhabta ah ee qaabka Anchor ma soo baxaan (waa ku filan tahay in si fudud loogu daro xiriir cusub oo ku saabsan barroosinka u dhigma), laakiin naqshadeynta qaabka si loo soo bandhigo xaqiiqooyinka waa mid aan caddayn; oo soo bandhigaya qaabka shayga ganacsiga si aan caddayn.

Sida dabacsanaanta loo gaaro

Dhismaha ka dhashay labada kiisba wuxuu ka kooban yahay miisas aad u badan oo badanmarka loo eego cabbirka dhaqanka. Laakiin way qaadan kartaa boos disk aad u yar oo leh sifooyin la mid ah oo la habeeyey sida cabbirka dhaqanka. Dabcan, ma jiraan wax sixir ah halkan - waa wax walba oo ku saabsan caadi. Anagoo u qaybinayna sifooyinka satalaytka (ku jira kaydka xogta) ama miisaska gaarka ah (Modelka barroosinka), waxaanu yaraynaa (ama gabi ahaanba baabi'iyaa) nuqul ka mid ah qiyamka sifooyinka qaarkood marka la beddelo kuwa kale.

Si aad u Kaydka Xogta guushu waxay ku xirnaan doontaa qaybinta sifooyinka Satellite-ka, iyo Qaabka barroosinka - waxay si toos ah ugu dhowdahay tirada celceliska ee nooc kasta shay cabbiraadda.

Si kastaba ha ahaatee, kaydinta boosku waa muhiim, laakiin maaha ta ugu weyn, faa'iidada kaydinta sifooyinka si gaar ah. Si wada jir ah kaydinta gaarka ah ee cilaaqaadka, habkani wuxuu dhigayaa bakhaarka naqshadeynta modular. Tani waxay ka dhigan tahay in lagu darayo sifooyin gaar ah iyo dhammaan mawduucyada cusub ee qaabkan oo kale u eg dhisme sare in ka badan shay jira oo aan la beddelin. Tanina waa sida saxda ah tan ka dhigaysa hababka lagu tilmaamay kuwo dabacsan.

Tani waxay sidoo kale u egtahay kala-guurka ka soo baxa wax-soo-saarka gabalka ilaa wax-soo-saarka ballaaran - haddii habka dhaqameedka miis kasta oo ka mid ah moodeelku uu yahay mid gaar ah oo u baahan fiiro gaar ah, ka dibna hababka dabacsan ee horeba waa jaangooyooyin "qaybo". Dhinaca kale, waxaa jira miisas badan, iyo hababka rarista iyo soo celinta xogta waa inay u muuqdaan kuwo aad u adag. Dhanka kale, waxay noqdaan caadiga ah. Taas oo macnaheedu yahay inay jiri karto si otomaatig ah iyo metadata loo wado. Su'aasha "Sideen u dhigi doonaa?", Jawaabta taas oo qaadan karta qayb muhiim ah oo ka mid ah shaqada naqshadeynta hagaajinta, hadda maaha mid u qalantaa (sidoo kale su'aasha ku saabsan saameynta beddelka moodeelka ee hababka shaqada ).

Tani macnaheedu maaha in falanqeeyayaasha aan looga baahnayn nidaamkan oo dhan - qof wali waa inuu ka shaqeeyaa walxaha walxaha leh sifooyin iyo inuu ogaado meesha iyo sida loo buuxiyo dhammaan. Laakiin qadarka shaqada, iyo sidoo kale suurtogalnimada iyo kharashka qaladka, ayaa si weyn loo dhimay. Labadaba marxaladda falanqaynta iyo inta lagu jiro horumarinta ETL, taas oo qayb muhiim ah lagu dhimi karo tafatirka metadata.

Dhinac madow

Dhammaan kuwan kor ku xusan waxay labada habba ka dhigaan kuwo si dhab ah u dabacsan, tignoolajiyada horumarsan oo ku habboon horumarinta soo noqnoqoshada. Dabcan, waxaa sidoo kale jira "foostada boomaatada", taas oo aan u maleynayo inaad horeba u malayn karto.

Burburinta xogta, taas oo hoosta ka xariiqaysa qaab-dhismeedka qaab-dhismeedka dabacsan, waxay keenaysaa korodhka tirada miisaska iyo, sidaas awgeed, dusha sare ku biirista marka muunad la samaynayo. Si aad si fudud u hesho dhammaan sifooyinka cabbirka, dukaanka caadiga ah hal doorasho ayaa ku filan, laakiin qaab dhismeedka dabacsan wuxuu u baahan doonaa taxane dhan oo isku xiran. Waxaa intaa dheer, haddii kuwan oo dhan ay ku biiraan warbixinnada horay loo qori karaa, markaa falanqeeyayaasha caadaystay inay SQL ku qoraan gacanta ayaa labanlaabmi doona.

Waxaa jira dhowr xaqiiqo oo xaaladdan fududeynaya:

Markaad la shaqeyneyso cabbirro waaweyn, dhammaan sifooyinkeeda ayaa ah kuwa aan waligood la isticmaalin isku mar. Tani waxay ka dhigan tahay in ay jiri karaan isku-xidho ka yar inta ay u muuqato jaleecada hore ee moodeelka. Data Vault waxa kale oo ay ku xisaabtami kartaa inta jeer ee la filayo in la wadaago marka loo qoondeynayo sifooyinka satalaytka. Isla mar ahaantaana, Hubs ama Barroosinada laftooda ayaa ugu horrayn looga baahan yahay abuurista iyo samaynta khariidadaha beddelka ee heerka rarida oo marar dhif ah looma isticmaalo su'aalaha (tani waxay si gaar ah run u tahay Barbarrada).

Dhammaan ku biirista waa furaha. Intaa waxaa dheer, hab badan oo "cadaadis" ah oo lagu kaydiyo xogta waxay yaraynaysaa dusha sare ee miisaska iskaanka halka looga baahan yahay (tusaale ahaan, marka lagu sifeeyo qiimaha sifada). Tani waxay u horseedi kartaa xaqiiqda ah in muunad laga soo qaado kaydka xogta caadiga ah oo leh farabadan isku xidhan ay ka dhakhso badan tahay in la sawiro hal cabbir oo culus oo leh noocyo badan oo isku xigta.

Tusaale ahaan, halkan in tan Maqaalku wuxuu ka kooban yahay imtixaan isbarbardhig faahfaahsan oo ku saabsan waxqabadka moodeelka barroosinka oo muunad laga soo qaaday hal miis.

Wax badan ayaa ku xiran mishiinka. Meelo badan oo casri ah ayaa leh hababka hagaajinta isku-xidhka gudaha. Tusaale ahaan, MS SQL iyo Oracle waxay "ka boodi karaan" ku biirista miisaska haddii xogtooda aan loo isticmaalin meel kasta marka laga reebo ku biirista kale oo aysan saameyn ku yeelan doorashada kama dambaysta ah (miiska / ka saarista ku biirista), iyo MPP Vertica waayo-aragnimada asxaabta ka socota Avito, ayaa la caddeeyey inuu yahay matoor aad u wanaagsan Modelka barroosinka, iyadoo la siiyay qaar ka mid ah hagaajinta gacanta ee qorshaha weydiinta. Dhinaca kale, kaydinta Modelka Anchor, tusaale ahaan, on Click House, kaas oo xaddiday taageerada ku biirista, weli uma eka fikrad aad u wanaagsan.

Intaa waxaa dheer, labada qaab-dhismeedka waxaa jira dhaqaaqo gaar ah, taasoo sahlaysa helitaanka xogta (labadaba marka laga eego waxqabadka su'aalaha iyo isticmaalayaasha dhamaadka). Tusaale ahaan, Shaxda-Waqtiga-Wakhtiga in Data Vault ama hawlaha miiska gaarka ah ee qaabka Anchor.

Wadarta

Nuxurka ugu muhiimsan ee naqshadaha dabacsan ee la tixgeliyey waa qaab-dhismeedka "naqshaddooda".

Waa hantida u ogolanaysa:

  • Ka dib qaar ka mid ah diyaarinta bilawga ah ee la xidhiidha geynta metadata iyo qorista algorithms ETL ee aasaasiga ah, si dhakhso ah u sii macmiilka natiijada ugu horreysa qaab dhowr warbixin oo ka kooban xog laga soo qaatay dhowr shay. Muhiim ma aha in si buuxda looga fikiro (xitaa heerka sare) qaabka shayga oo dhan.
  • Qaabka xogta ayaa ku bilaabi kara shaqada (oo faa'iido leh) 2-3 shay oo kaliya, ka dibna si tartiib tartiib ah u koraan (oo ku saabsan model Anchor Nikolai codsatay marka la barbardhigo mycelium).
  • Inta badan horumarinta, oo ay ku jiraan ballaarinta aagga mawduuca iyo ku darida ilo cusub ma saameynayso shaqada jirta mana keenayso khatar ah in la jebiyo shay horeba u shaqaynayay.
  • Waad ku mahadsan tahay kala-goynta walxaha caadiga ah, hababka ETL ee nidaamyada noocan oo kale ah waxay u egyihiin isku mid, qoraalladoodu waxay isku daydaa algorithmization iyo, ugu dambeyntii, automation.

Qiimaha dabacsanaantan waa waxqabadka. Tani macnaheedu maaha in aysan suurtagal ahayn in la gaaro waxqabadka la aqbali karo ee moodooyinka noocaas ah. Inta badan, waxaa laga yaabaa inaad si fudud ugu baahan tahay dadaal dheeri ah iyo fiiro gaar ah si aad u gaarto cabbirada aad rabto.

apps

Noocyada hay'adda Kaydka Xogta

Dulmarka Hababka Naqshad ee Agile DWH

Macluumaad dheeraad ah oo ku saabsan Vault Data:
Shabakadda Dan Lystadt
Dhammaan ku saabsan Vault Data ee Ruushka
Ku saabsan Vault Data ee HabrΓ©

Noocyada hay'adda Qaabka Barroosinka

Dulmarka Hababka Naqshad ee Agile DWH

Faahfaahin dheeraad ah oo ku saabsan Model Anchor:

Shabakadda abuurayaasha Model Anchor
Maqaal ku saabsan waayo-aragnimada hirgelinta Model Anchor ee Avito

Shax kooban oo leh astaamo guud iyo kala duwanaanshiyaha hababka la tixgaliyo:

Dulmarka Hababka Naqshad ee Agile DWH

Source: www.habr.com

Add a comment