Overview ny Agile DWH Design Methodologies

Ny famolavolana trano fitahirizana dia asa lava sy matotra.

Ny ankamaroan'ny fiainan'ny tetikasa iray dia miankina amin'ny fiheverana tsara ny modelin'ny zavatra sy ny rafitra fototra eo am-piandohana.

Ny fomba fiasa ekena amin'ny ankapobeny dia ary mijanona ho karazany isan-karazany amin'ny fampifangaroana ny kintana amin'ny endrika mahazatra fahatelo. Toy ny fitsipika, araka ny fitsipika: voalohany angona - 3NF, fampisehoana - kintana. Ity fomba fiasa ity, voasedra amin'ny fotoana ary tohanan'ny fikarohana be dia be, no zavatra voalohany (ary indraindray ihany) tonga ao an-tsain'ny manam-pahaizana DWH za-draharaha rehefa mieritreritra ny tokony ho endriky ny tahiry analytical.

Amin'ny lafiny iray, ny fandraharahana amin'ny ankapobeny sy ny fepetra takian'ny mpanjifa manokana dia mirona hiova haingana, ary ny angon-drakitra dia mihamitombo na "lalina" sy "amin'ny sakany". Ary eto no miseho ny tena tsy fahampian'ny kintana - voafetra manovaova.

Ary raha tampoka eo amin'ny fiainanao mangina sy milamina amin'ny maha-mpamorona DWH anao:

  • Nipoitra ny asa "hanao zavatra haingana farafaharatsiny, ary avy eo dia ho hitantsika";
  • nisy tetik'asa mivoatra haingana, miaraka amin'ny fampifandraisana loharano vaovao sy fanavaozana ny maodely fandraharahana farafahakeliny indray mandeha isan-kerinandro;
  • Nipoitra ny mpanjifa izay tsy mahafantatra ny tokony ho endrik'ilay rafitra sy ny asa tokony hataony amin'ny farany, fa vonona ny hanandrana sy hanatsara tsy tapaka ny vokatra tadiavina ary manakaiky azy hatrany;
  • Niditra tamin’ilay vaovao tsara ilay mpiandraikitra ny tetik’asa hoe: “Ary izao isika dia mahay!”

Na raha toa ianao ka liana amin'ny fitadiavana ny fomba hafa ahafahanao manangana trano fitahirizana - tongasoa eto amin'ny tapaka!

Overview ny Agile DWH Design Methodologies

Inona no dikan'ny hoe "flexibilité"?

Andeha aloha hofaritana hoe inona ny toetra tsy maintsy ananan'ny rafitra iray mba hantsoina hoe “flexible”.

Misaraka dia tokony ho lazaina fa ny fananana voalaza dia tokony mifandray manokana amin'ny RAFITRA, tsy mba DINGANA ny fivoarany. Noho izany, raha te hamaky momba ny Agile ho fomba fampandrosoana ianao dia tsara kokoa ny mamaky lahatsoratra hafa. Ohatra, eo, ao amin'ny Habré, misy fitaovana mahaliana maro (toy ny FAMERENANA и AZO AMPIHARINA, ary olana).

Tsy midika izany fa tsy misy ifandraisany tanteraka ny fizotran'ny fampandrosoana sy ny firafitry ny trano fanatobiana data. Amin'ny ankapobeny, tokony ho mora kokoa ny mamolavola tahiry Agile ho an'ny maritrano agile. Na izany aza, amin'ny fampiharana, matetika dia misy safidy miaraka amin'ny Agile fampandrosoana ny DWH mahazatra araka ny Kimbal sy DataVault - araka ny Waterfall, noho ny fifanandrifian-javatra faly amin'ny flexibility amin'ny endrika roa amin'ny tetikasa iray.

Noho izany, inona ny fahaiza-manao tokony ananan'ny fitahirizana mora azo? Misy teboka telo eto:

  1. Fanaterana aloha sy fihodinana haingana - midika izany fa ny vokatra ara-barotra voalohany (ohatra, ny tatitra momba ny asa voalohany) dia tokony ho azo haingana araka izay azo atao, izany hoe, alohan'ny hamolavolana sy hampiharana tanteraka ny rafitra manontolo. Ambonin'izany, ny fanavaozana tsirairay manaraka dia tokony haka fotoana kely araka izay azo atao.
  2. Fanavaozana miverimberina - midika izany fa tsy tokony hisy fiantraikany amin'ny fiasa efa miasa ny fanatsarana manaraka. Amin'io fotoana io matetika no lasa nofy ratsy indrindra amin'ny tetikasa lehibe - na ho ela na ho haingana, manomboka mahazo fifandraisana be dia be ny zavatra tsirairay ka lasa mora kokoa ny mamerina tanteraka ny lojika amin'ny dika mitovy eo akaiky kokoa noho ny manampy saha amin'ny latabatra efa misy. Ary raha gaga ianao fa ny famakafakana ny fiantraikan'ny fanatsarana amin'ny zavatra efa misy dia mety haka fotoana bebe kokoa noho ny fanatsarana ny tenany, dia azo inoana fa mbola tsy niara-niasa tamin'ny trano fanatobiana data lehibe amin'ny banky na telecoms ianao.
  3. Mampifanaraka tsy tapaka amin'ny fanovana ny fepetra takian'ny orinasa - ny firafitry ny zavatra ankapobeny dia tokony hamboarina tsy amin'ny fiheverana ny mety ho fanitarana fotsiny, fa amin'ny fanantenana fa ny fitarihana ity fanitarana manaraka ity dia tsy ho nofinofy akory amin'ny dingana famolavolana.

Ary eny, ny mahafeno ireo fepetra rehetra ireo amin'ny rafitra iray dia azo atao (mazava ho azy, amin'ny tranga sasany sy amin'ny famandrihana sasany).

Eto ambany aho dia handinika ny roa amin'ireo fomba fandrafetana agile malaza indrindra ho an'ny trano fanatobiana data - Modely vatofantsika и Data Vault. Tavela amin'ny fononteny dia teknika tena tsara toy ny, ohatra, EAV, 6NF (amin'ny endriny madio) ary ny zava-drehetra mifandraika amin'ny vahaolana NoSQL - tsy hoe satria ratsy kokoa izy ireo, ary na dia amin'ity tranga ity aza dia mety handrahona ny hahazo ny lahatsoratra. ny habetsaky ny disser antonony. Izany rehetra izany dia mifandraika amin'ny vahaolana amin'ny kilasy hafa kely - na amin'ny teknika azonao ampiasaina amin'ny tranga manokana, na inona na inona rafitra ankapobeny amin'ny tetikasanao (toy ny EAV), na amin'ny paradigma fitahirizana vaovao hafa manerantany (toy ny angon-drakitra grafika). ary safidy hafa NoSQL).

Ny olan'ny fomba fiasa "klasika" sy ny famahana azy ireo amin'ny fomba mora azo

Ny fomba fiasa "klasika" no tiako holazaina dia ilay kintana taloha tsara (na inona na inona fampiharana manokana ny sosona fototra, enga anie ny mpanaraka an'i Kimball, Inmon ary CDM hamela ahy).

1. Henjana kardinaly ny fifandraisana

Ity modely ity dia mifototra amin'ny fizarana mazava ny angona lafiny и MOMBAMOMBA. Ary lojika izany, raha ny marina, ny famakafakana ny angon-drakitra amin'ny ankamaroan'ny tranga dia midina amin'ny famakafakana ny tondro (zava-misy) sasany amin'ny fizarana sasany (dimensions).

Amin'ity tranga ity, ny fifandraisana eo amin'ny zavatra dia napetraka amin'ny endrika fifandraisana eo amin'ny latabatra mampiasa fanalahidy vahiny. Toa voajanahary izany, fa avy hatrany dia mitarika ho amin'ny fetra voalohany amin'ny flexibilité - famaritana hentitra ny kardinaly ny fifandraisana.

Midika izany fa eo amin'ny dingan'ny famolavolana latabatra dia tsy maintsy mamaritra tsara ho an'ny zavatra roa mifandray ianao raha afaka mifandray amin'ny maro-amin'ny-maro, na 1-amin'ny-maro ihany, ary "amin'ny lalana aiza". Izany dia mamaritra mivantana hoe iza no latabatra hanana ny fanalahidy fototra ary iza no hanana ny fanalahidy vahiny. Ny fanovana io toe-tsaina io rehefa voaray ny fepetra vaovao dia mety hitarika amin'ny famerenana indray ny fototra.

Ohatra, rehefa mamolavola ny zavatra "fahazoam-bola", ianao, miankina amin'ny fianianan'ny departemantan'ny varotra, dia nametraka ny mety hisian'ny hetsika. fisondrotana iray ho an'ny toerana fanamarinana maromaro (fa tsy ny mifamadika amin'izany):

Overview ny Agile DWH Design Methodologies
Ary rehefa afaka kelikely, ny mpiara-miasa dia nampiditra paikady ara-barotra vaovao izay ahafahan'izy ireo miasa amin'ny toerana mitovy fisondrotana maromaro miaraka. Ary ankehitriny dia mila manova ny latabatra ianao amin'ny fanasarahana ny fifandraisana ho zavatra misaraka.

(Mila hatsaraina ihany koa ny zavatra azo avy amin'izany izay iarahana amin'ny fanamarinana fampiroboroboana ankehitriny).

Overview ny Agile DWH Design Methodologies
Fifandraisana amin'ny Data Vault sy Modely Vatofantsika

Ny fialana amin'ity toe-javatra ity dia nanjary tsotra: tsy mila matoky ny departemantan'ny varotra ianao hanao izany. ny fifandraisana rehetra dia voatahiry ao anaty tabilao misaraka amin'ny voalohany ary manodina azy toy ny maro-to-maro.

Io fomba fiasa io no naroso Dan Linstedt ao anatin'ny paradigma Data Vault ary tohana tanteraka Lars Rönnbäck в Modely vatofantsika.

Vokatr'izany dia mahazo ny endri-javatra miavaka voalohany amin'ny metodolojia mora azo isika:

Ny fifandraisana eo amin'ny zavatra dia tsy voatahiry ao amin'ny toetran'ny sampan-draharahan'ny ray aman-dreny, fa karazana zavatra misaraka.

В Data Vault tabilao mampifandray toy izany no antsoina Link, ary ao Modely vatofantsika - Tie. Raha vao jerena dia tena mitovy izy ireo, na dia tsy mifarana amin'ny anarana aza ny fahasamihafana (izay horesahina etsy ambany). Amin'ireo maritrano roa ireo dia afaka mampifandray ny latabatra rohy izay isan'ny sampana (tsy voatery 2).

Ity redundancy ity, raha vao jerena, dia manome fahafahana lehibe ho an'ny fanovana. Ny rafitra toy izany dia lasa mandefitra tsy amin'ny fiovan'ny kardinaly amin'ny rohy efa misy, fa amin'ny fanampiana ireo vaovao ihany koa - raha toa ka misy rohy misy rohy mankany amin'ny cashier izay namaky azy ihany koa ny fisehon'ny rohy toy izany. lasa add-on amin'ny latabatra efa misy nefa tsy misy fiantraikany amin'ny zavatra sy ny dingana efa misy.

Overview ny Agile DWH Design Methodologies

2. Fandikana ny angona

Ny olana faharoa voavaha amin'ny alàlan'ny maritrano malefaka dia tsy dia mibaribary loatra ary misy hatrany amin'ny toerana voalohany. Ireo singa mifandraika amin'ny SCD2 (miova tsikelikely ny refy amin'ny karazana faharoa), na dia tsy izy ireo ihany aza.

Ao amin'ny trano fanatobiana entana mahazatra, ny refy dia mazàna dia latabatra misy lakile mpisolo toerana (toy ny PK) sy andiana fanalahidin'ny orinasa sy toetra ao anaty tsanganana misaraka.

Overview ny Agile DWH Design Methodologies

Raha toa ny refy iray dia manohana ny famoahana, dia ampiana ny fetran'ny fahamendrehan'ny dikan-teny ao amin'ny andiana saha manara-penitra, ary misy dikan-teny maromaro miseho ao amin'ny tahiry ho an'ny andalana iray ao amin'ny loharano (iray isaky ny fiovana amin'ny toetra voadika).

Raha misy refy iray fara-fahakeliny iray miova matetika dikan-teny, ny isan'ny dikan-ny refy toy izany dia ho mahavariana (na dia ny sisa toetra tsy voadika na tsy miova mihitsy), ary raha misy maromaro toy izany toetra dia afaka ny isan'ny dikan-. mitombo tsikelikely avy amin'ny isany. Ity refy ity dia mety haka habaka kapila be dia be, na dia dika mitovy amin'ny sanda toetra tsy azo ovaina avy amin'ny andalana hafa aza ny ankamaroan'ny angon-drakitra voatahiny.

Overview ny Agile DWH Design Methodologies

Amin'izay fotoana izay ihany koa dia matetika ampiasaina izy io denormalization - ny toetra sasany dia iniana tehirizina ho sanda, fa tsy ho rohy mankany amin'ny boky reference na refy hafa. Ity fomba fiasa ity dia manafaingana ny fidirana amin'ny angona, mampihena ny isan'ny mitambatra rehefa miditra amina refy iray.

Matetika izany dia mitarika amin'ny ny vaovao mitovy dia voatahiry miaraka amin'ny toerana maromaro. Ohatra, ny fampahalalana momba ny faritra fonenana sy ny sokajy mpanjifa dia azo tahirizina ao amin'ny refy "Client" sy ny zava-misy "Purchase", "Livraison" ary "Call Center Calls", ary koa ao amin'ny "Client - Client Manager". ” latabatra rohy.

Amin'ny ankapobeny, io voalaza etsy ambony io dia mihatra amin'ny refy mahazatra (tsy misy dikan-teny), fa amin'ny dikan-teny dia mety manana mari-pamantarana hafa izy ireo: ny fisehoan'ny dikan-teny vaovao amin'ny zavatra iray (indrindra fa amin'ny fijerena indray) dia tsy mitondra any amin'ny fanavaozana ny mifandraika rehetra. tabilao, fa amin'ny fisehoana mihetsiketsika amin'ny dikan-teny vaovao mifandraika amin'izany - rehefa ampiasaina ny tabilao 1 hanamboarana ny tabilao 2, ary ny tabilao 2 dia ampiasaina hanamboarana ny tabilao 3, sns. Na dia tsy misy toetra iray ao amin'ny tabilao 1 aza no tafiditra amin'ny fananganana ny tabilao 3 (ary ny toetra hafa ao amin'ny tabilao 2 azo avy amin'ny loharano hafa dia tafiditra), ny famoahana an'io fananganana io dia mety hitarika ho amin'ny overhead fanampiny, ary amin'ny fara-tampony ho fanampiny. dikan-teny ao amin'ny tabilao 3. izay tsy misy ifandraisany amin'izany mihitsy, ary midina hatrany amin'ny rojo.

Overview ny Agile DWH Design Methodologies

3. Ny fahasarotana tsy an-dalana amin'ny fanavaozana

Mandritra izany fotoana izany, ny tranombarotra vaovao tsirairay miorina amin'ny fototry ny iray hafa dia mampitombo ny isan'ny toerana ahafahan'ny angon-drakitra "misaraka" rehefa misy fanovana natao amin'ny ETL. Izany, indray, dia mitarika amin'ny fitomboan'ny fahasarotana (sy ny faharetan'ny) isaky ny fanavaozana manaraka.

Raha mamaritra ny rafitra miaraka amin'ny fizotry ny ETL tsy dia novaina ny etsy ambony, dia afaka miaina amin'ny paradigma toy izany ianao - mila maka antoka fotsiny ianao fa misy fanovana vaovao natao tsara amin'ny zavatra mifandraika rehetra. Raha mitranga matetika ny fanavaozana, dia mitombo be ny mety hisian'ny "tsy nahy" fifandraisana maro.

Raha, ho fanampin'izany, dia raisinay fa sarotra kokoa noho ny "tsy versioned" ny ETL "versioned", dia lasa sarotra ny misoroka ny hadisoana rehefa manavao matetika ity fitaovana ity.

Mitahiry zavatra sy toetra ao amin'ny Data Vault sy Modely Vatofantsika

Ny fomba fiasa naroson'ny mpanoratra ny maritrano flexible dia azo amboarina toy izao manaraka izao:

Ilaina ny manasaraka izay miova amin'izay mbola tsy miova. Izany hoe, mitahiry fanalahidy misaraka amin'ny toetra.

Na izany aza, tsy tokony hampifangaro tsy versioned toetra miaraka amin'ny niova: ny voalohany dia tsy mitahiry ny tantaran'ny fiovany, fa afaka miova (ohatra, rehefa manitsy ny lesoka fampidirana na mandray data vaovao); ny faharoa dia tsy miova mihitsy.

Ny fomba fijery dia tsy mitovy amin'izay tena azo raisina ho tsy miova ao amin'ny Data Vault sy ny Modely Vatofantsika.

Avy amin'ny fomba fijery ara-javakanto Data Vault, azo heverina ho tsy miova fitambarana fanalahidy - voajanahary (TIN an'ny fikambanana, kaody vokatra ao amin'ny rafitra loharano, sns.) ary solon-tena. Amin'ity tranga ity, ny toetra sisa dia azo zaraina ho vondrona araka ny loharano sy/na matetika ny fiovana sy Mitazona latabatra manokana ho an'ny vondrona tsirairay miaraka amin'ny andiany tsy miankina amin'ny dikan-teny.

Ao amin'ny paradigma Modely vatofantsika heverina ho tsy miova fanalahidy solon-tena ihany essence. Ny zavatra hafa rehetra (anisan'izany ny fanalahidy voajanahary) dia tranga manokana momba ny toetrany. izay ny toetra rehetra dia tsy miankina amin'ny tsirairay avy, ka isaky ny toetra a latabatra misaraka.

В Data Vault tabilao misy fanalahidin'ny enti-manana no antsoina Hubami. Ny Hubs dia ahitana saha raikitra hatrany:

  • Keys entity voajanahary
  • Fanoloana fanalahidy
  • Rohy mankany amin'ny loharano
  • Raketo fotoana fanampiny

Lahatsoratra ao amin'ny Hubs tsy miova mihitsy ary tsy manana version. Ety ivelany, ny hubs dia tena mitovy amin'ny tabilao karazana ID-sarintany ampiasaina amin'ny rafitra sasany hamokatra solon-tena, na izany aza, soso-kevitra ny hampiasa tenifototra avy amin'ny fanalahidin'ny orinasa iray ho solon'ny Data Vault. Ity fomba fiasa ity dia manamora ny fametrahana ny fifandraisana sy ny toetra avy amin'ny loharano (tsy mila miditra amin'ny hub mba hahazoana solon-tena, kajy fotsiny ny hash amin'ny fanalahidy voajanahary), fa mety hiteraka olana hafa (mifandraika amin'ny fifandonana, tranga ary tsy azo pirinty. litera amin'ny fanalahidin'ny tady, sns. .p.), noho izany dia tsy ekena amin'ny ankapobeny izany.

Ny toetra hafa rehetra dia voatahiry ao anaty tabilao manokana antsoina hoe zanabolana. Ny habaka iray dia afaka manana zanabolana maromaro mitahiry karazana toetra samihafa.

Overview ny Agile DWH Design Methodologies

Ny fizarana ny toetra eo amin'ny zanabolana dia mitranga araka ny fitsipika fiovana iombonana - amin'ny zanabolana iray dia azo tehirizina ny toetra tsy misy dikan-teny (ohatra, daty nahaterahana sy SNILS ho an'ny olona iray), amin'ny iray hafa - zara raha manova ny dikan-teny (ohatra, anarana sy laharan'ny pasipaoro), ao amin'ny fahatelo - miova matetika (ohatra, adiresy fanaterana, sokajy, datin'ny kaomandy farany, sns.). Amin'ity tranga ity, ny versioning dia atao amin'ny haavon'ny zanabolana tsirairay, fa tsy ny sampana manontolo, noho izany dia tsara ny mizara ny toetra mba ho kely indrindra ny fihaonan'ny dikan-teny ao anatin'ny zanabolana iray (izay mampihena ny isan'ny dikan-teny voatahiry. ).

Ary koa, mba hanamafisana ny fizotran'ny fampidinana angon-drakitra, ny toetra azo avy amin'ny loharano samihafa dia matetika ampidirina amin'ny zanabolana tsirairay.

Ny zanabolana dia mifandray amin'ny Hub amin'ny alàlan'ny fanalahidy vahiny (izay mifanitsy amin'ny kardinaly 1-to-maro). Midika izany fa ny soatoavin'ny toetra maro (ohatra, laharana finday maro ho an'ny mpanjifa iray) dia tohanan'ity maritrano "default".

В Modely vatofantsika latabatra mitahiry fanalahidy no antsoina vatofantsika. Ary hoy izy ireo:

  • Fanoloana fanalahidy ihany
  • Rohy mankany amin'ny loharano
  • Raketo fotoana fanampiny

Ny fanalahidy voajanahary avy amin'ny fomba fijerin'ny Modely Vatofantsika dia raisina toetra mahazatra. Ity safidy ity dia mety ho toa sarotra kokoa ny mahazo azy, saingy manome fahafahana bebe kokoa hamantarana ilay zavatra.

Overview ny Agile DWH Design Methodologies

Ohatra, raha mety ho avy amin'ny rafitra samihafa ny angon-drakitra momba ny enti-manana iray, ny tsirairay amin'izy ireo dia mampiasa ny lakile voajanahary. Ao amin'ny Data Vault, izany dia mety hitarika ho amin'ny rafitra somary saro-takarina amin'ny habaka maromaro (iray isaky ny loharano + dikan-tenin'ny master mampiray), raha ao amin'ny maodely Anchor, ny lakile voajanahary amin'ny loharano tsirairay dia latsaka amin'ny toetrany manokana ary azo ampiasaina rehefa misintona tsy miankina. ny hafa rehetra.

Saingy misy teboka iray mamitaka ihany koa eto: raha atambatra ao anaty singa iray ny toetra avy amin'ny rafitra samihafa, dia azo inoana fa misy ny sasany. fitsipiky ny "gluing", izay tsy maintsy takatry ny rafitra fa ny firaketana avy amin'ny loharano samihafa dia mifanandrify amin'ny tranga iray an'ny orinasa.

В Data Vault ireo fitsipika ireo no tena mety hamaritra ny fananganana "surrogate hub" an'ny sampana tompony ary tsy misy fiantraikany amin'ny Hubs izay mitahiry ny fanalahidin'ny loharano voajanahary sy ny toetrany tany am-boalohany. Raha toa ka miova ny fitsipika mampitambatra (na nohavaozina ny toetra anatanterahana azy), dia ho ampy ny hanovana ny toeran'ny mpisolo toerana.

В Modely vatofantsika ny orinasa toy izany dia azo inoana fa hotehirizina ao ny vatofantsika ihany. Midika izany fa ny toetra rehetra, na inona na inona loharano nihaviany, dia hifamatotra amin'ny solon-tena iray ihany. Ny fanavahana ireo firaketana diso natambatra ary, amin'ny ankapobeny, ny fanaraha-maso ny maha-zava-dehibe ny fampifangaroana amin'ny rafitra toy izany dia mety ho sarotra kokoa, indrindra raha toa ka sarotra be ny fitsipika ary miova matetika, ary ny toetra mitovy dia azo avy amin'ny loharano samihafa (na dia azo antoka aza izany. azo atao, satria ny dikan-teny tsirairay dia mitazona rohy mankany amin'ny loharano).

Na izany na tsy izany, raha toa ka tokony hampihatra ny fiasa ny rafitrao deduplication, fanakambanana rakitsoratra ary singa MDM hafa, dia ilaina ny mandinika manokana ny lafiny fitahirizana fanalahidy voajanahary amin'ny fomba mavitrika. Azo inoana fa ho azo antoka kokoa tampoka ny famolavolana Data Vault lehibe kokoa amin'ny resaka lesoka mampitambatra.

Modely vatofantsika dia manome karazana zavatra fanampiny antsoina hoe fatotra tena manokana izany karazana vatofantsika mihasimba, izay tsy misy afa-tsy toetra iray. Ny nodes dia tokony ampiasaina hitahiry lahatahiry fisaka (ohatra, lahy sy vavy, sata ara-panambadiana, sokajy serivisy mpanjifa, sns.). Tsy toy ny Vatofantsika, ny Knot tsy manana latabatra toetra mifandray, ary ny hany toetrany (anarana) dia voatahiry ao anaty latabatra miaraka amin'ny fanalahidy. Ampifandraisina amin'ny Vatofantsika amin'ny alàlan'ny tabilao fatorana (Tie) ny nodes amin'ny fomba mitovy amin'ny fifandraisan'ny Vatofantsika.

Tsy misy hevitra mazava momba ny fampiasana ny Nodes. Ohatra, Nikolay Golov, izay mampiroborobo ny fampiasana ny Modely Vatofantsika ao Rosia, dia mino (tsy amin'ny antony) fa tsy misy boky fanoroana hevitra iray dia azo ambara amim-pahatokiana fa izany. foana dia ho static sy tokana, noho izany dia tsara kokoa ny mampiasa avy hatrany Vatofantsika feno ho an'ny zavatra rehetra.

Ny fahasamihafana lehibe hafa eo amin'ny Data Vault sy ny modely Anchor dia ny fisian'ny toetran'ny fifandraisana:

В Data Vault Ny rohy dia zavatra feno mitovy amin'ny Hubs, ary afaka manana toetra manokana. The Modely vatofantsika Ny rohy dia ampiasaina mba hampifandraisana ny Vatofantsika sy tsy afaka manana ny toetrany manokana. Io fahasamihafana io dia miteraka fomba fiasa modely tena samihafa MOMBAMOMBA, izay horesahina bebe kokoa.

fitahirizana zava-misy

Talohan'ity, niresaka indrindra momba ny fandrefesana modely. Somary tsy mazava ny zava-misy.

В Data Vault zavatra mahazatra amin'ny fitehirizana zava-misy dia Rohy, ao amin'ny satelita misy ireo famantarana tena izy.

Toa intuitive io fomba fiasa io. Izy io dia manome fahafahana miditra mora amin'ireo tondro voadinika ary amin'ny ankapobeny dia mitovy amin'ny tabilao zava-misy mahazatra (ny tondro ihany no voatahiry tsy ao anaty latabatra, fa ao amin'ny latabatra "mifanolo-bodirindrina"). Saingy misy ihany koa ny fandrika: iray amin'ireo fanovana mahazatra ny modely - ny fanitarana ny fanalahidin'ny zava-misy - ilaina. manampy fanalahidy vahiny vaovao amin'ny Rohy. Ary izany, ho setrin'izany, dia "manapaka" ny modularity ary mety hiteraka filàna fanovana amin'ny zavatra hafa.

В Modely vatofantsika Ny fifandraisana dia tsy afaka manana ny toetrany manokana, noho izany dia tsy hahomby io fomba fiasa io - ny toetra sy ny tondro rehetra dia tsy maintsy ampifandraisina amin'ny vatofantsika iray manokana. Tsotra ny fehin-kevitra avy amin'izany - Mila vatofantsika manokana ihany koa ny zava-misy tsirairay. Ho an'ny sasany amin'ireo zavatra efa mahazatra antsika ho toy ny zava-misy, dia mety ho voajanahary izany - ohatra, ny zava-misy amin'ny fividianana dia azo ahena tanteraka amin'ny zavatra "baiko" na "fahazoan-dàlana", mitsidika tranokala iray amin'ny fivoriana, sns. Saingy misy ihany koa ny zava-misy izay tsy dia mora ny mahita "zavatra mitondra" voajanahary toy izany - ohatra, ny sisa tavela amin'ny trano fanatobiana entana isaky ny fiandohan'ny andro.

Noho izany, ny olana amin'ny modularity rehefa manitatra ny zava-misy manan-danja ao amin'ny modely vatofantsika dia tsy mipoitra (afaka manampy fotsiny fifandraisana vaovao amin'ny mifanitsy amin'ny Vatofantsika), fa ny famolavolana modely mba hampisehoana ny zava-misy dia tsy dia mazava loatra; "artificial" vatofantsika mety hiseho izay mampiseho ny modelim-barotra amin'ny fomba tsy mazava.

Ny fomba hahazoana ny flexibilité

Ny fanorenana vokatr'ireo tranga roa ireo dia misy tena betsaka kokoa ny latabatranoho ny fandrefesana nentim-paharazana. Saingy mety haka izany mihena be ny habaka kapila miaraka amin'ireo toetra voadika mitovy amin'ny refy nentim-paharazana. Mazava ho azy fa tsy misy majika eto - momba ny normalization daholo izany. Amin'ny fizarana toetra manerana ny zanabolana (ao amin'ny Data Vault) na tabilao tsirairay (Modely Vatofantsika), dia mampihena (na manafoana tanteraka) dika mitovy ny soatoavin'ny toetra sasany rehefa manova ny hafa.

ho an'ny Data Vault ny fandresena dia miankina amin'ny fizarana ny toetra eo amin'ny zanabolana, ary ho an'ny Modely vatofantsika - saika mifanandrify mivantana amin'ny salan'isa isan'ny dikan-teny isaky ny zavatra fandrefesana.

Na izany aza, ny fitsitsiana toerana dia zava-dehibe, fa tsy ny lehibe indrindra, tombony amin'ny fitehirizana toetra misaraka. Miaraka amin'ny fitehirizana fifandraisana misaraka, io fomba fiasa io dia mahatonga ny fivarotana famolavolana modular. Midika izany fa ny fampidirana ny toetra tsirairay sy ny lohahevitra vaovao manontolo amin'ny modely toy izany dia toa superstructure amin'ny fitambaran-javatra efa misy nefa tsy manova azy ireo. Ary izany indrindra no mahatonga ireo metodôlôjia voalaza ho flexible.

Izany koa dia mitovy amin'ny fifindrana avy amin'ny famokarana sombintsombiny mankany amin'ny famokarana faobe - raha amin'ny fomba nentim-paharazana ny latabatra tsirairay amin'ny modely dia tsy manam-paharoa ary mitaky fiheverana manokana, dia amin'ny fomba malefaka dia efa misy "ampahany" mahazatra. Amin'ny lafiny iray, misy latabatra bebe kokoa, ary tokony ho sarotra kokoa ny fizotry ny fampidinana sy famerenana ny angona. Etsy andaniny, lasa izy ireo mahazatra. Izany hoe mety misy mandeha ho azy sy metadata. Ny fanontaniana hoe "Ahoana no hametrahantsika azy?", ny valiny izay mety handray anjara lehibe amin'ny asa amin'ny famolavolana fanatsarana, dia tsy mendrika izany (ary koa ny fanontaniana momba ny fiantraikan'ny fanovana ny modely amin'ny fizotran'ny asa). ).

Tsy midika akory izany fa tsy ilaina amin'ny rafitra toy izany mihitsy ny mpandinika - mbola mila miasa amin'ny alàlan'ny andian-javatra misy ny toetrany ny olona iray ary hamantatra hoe aiza sy ahoana no hampidirana azy rehetra. Saingy ny habetsaky ny asa, ary koa ny mety sy ny vidin'ny fahadisoana, dia mihena be. Na eo amin'ny sehatry ny famakafakana na mandritra ny fampivoarana ny ETL, izay amin'ny ampahany lehibe dia azo ahena amin'ny fanitsiana metadata.

Ila maizina

Ireo rehetra voalaza etsy ambony ireo dia mahatonga ireo fomba roa ireo ho tena miovaova, mandroso ara-teknolojia ary mety amin'ny fanatsarana miverimberina. Mazava ho azy fa misy ihany koa ny "barrel amin'ny menaka", izay heveriko fa efa azonao vinavinaina.

Ny fahapotehan'ny angona, izay miorim-paka amin'ny fiovaovan'ny maritrano mora azo, dia mitarika amin'ny fitomboan'ny isan'ny latabatra ary, araka izany, ambony mitambatra rehefa santionany. Mba hahazoana fotsiny ny toetra rehetra amin'ny refy iray, ao amin'ny magazay mahazatra dia ampy ny fifantenana iray, fa ny maritrano malefaka dia mitaky andiana fitambarana iray manontolo. Ambonin'izany, raha azo soratana mialoha ireo fitambarana rehetra ireo ho an'ny tatitra, dia hiharatsy avo roa heny ny mpandinika izay zatra manoratra SQL amin'ny tanana.

Misy zava-misy maromaro manamora ity toe-javatra ity:

Rehefa miasa amin'ny refy lehibe, ny toetrany rehetra dia saika tsy ampiasaina miaraka. Midika izany fa mety ho vitsy kokoa ny mitambatra noho ny hita amin'ny voalohany amin'ny modely. Ny Data Vault dia afaka mandinika ihany koa ny faharetan'ny fifampizaràna andrasana rehefa mizara toetra amin'ny zanabolana. Mandritra izany fotoana izany, ny Hubs na ny Vatofantsika dia ilaina indrindra amin'ny famoronana sy fanaovana sari-tany mpisolo toerana eo amin'ny dingan'ny fampidinana ary zara raha ampiasaina amin'ny fanontaniana (marina indrindra ho an'ny Vatofantsika izany).

Ny fidirana rehetra dia amin'ny fanalahidy. Fanampin'izany, ny fomba fitehirizana angon-drakitra bebe kokoa dia mampihena ny tampon'ny latabatra fitarafana izay ilaina (ohatra, rehefa manivana amin'ny sandan'ny toetra). Izany dia mety hitarika ho amin'ny zava-misy fa ny santionany avy amin'ny angon-drakitra ara-dalàna miaraka amin'ny vondron'olona maromaro dia ho haingana kokoa noho ny fisavana refy mavesatra iray misy dikan-teny maro isaky ny andalana.

Ohatra, eto amin'ny izany Ny lahatsoratra dia ahitana fitsapana fampitahana amin'ny antsipiriany momba ny fahombiazan'ny modely Vatofantsika miaraka amin'ny santionany amin'ny latabatra iray.

Miankina betsaka amin'ny motera. Sehatra maoderina maro no manana mekanika fanatsarana ny fidirana anatiny. Ohatra, ny MS SQL sy Oracle dia afaka "mitsipaka" miaraka amin'ny latabatra raha tsy ampiasaina na aiza na aiza ny angon-dry zareo afa-tsy amin'ny fidirana hafa ary tsy misy fiantraikany amin'ny fifantenana farany (fanafoanana ny latabatra/join), ary ny MPP Vertica traikefan'ny mpiara-miasa avy ao Avito, dia voaporofo fa maotera tena tsara ho an'ny Modely Vatofantsika, nomena ny fanatsarana ny drafitry ny fangatahana. Amin'ny lafiny iray, ny fitehirizana ny Modely Vatofantsika, ohatra, ao amin'ny Click House, izay voafetra ny fanohanana miaraka, dia tsy mbola toa hevitra tena tsara.

Ankoatra izany, ho an'ny architectures roa dia misy hetsika manokana, manamora ny fidiran'ny angon-drakitra (na avy amin'ny fomba fijery ny fahombiazan'ny fangatahana na ho an'ny mpampiasa farany). Ohatra, tabilao Point-In-Time ao amin'ny Data Vault na asa latabatra manokana amin'ny modely Anchor.

Итого

Ny tena maha-zava-dehibe an'ireo maritrano azo esorina dia ny modularity ny "design".

Io fananana io no ahafahana:

  • Taorian'ny fiomanana voalohany mifandraika amin'ny fametrahana metadata sy ny fanoratana algorithm ETL fototra, manome haingana ny mpanjifa ny vokatra voalohany amin'ny endrika tatitra roa misy angona avy amin'ny zavatra loharano vitsivitsy monja. Tsy ilaina ny mieritreritra tanteraka (na dia eo amin'ny ambaratonga ambony) ny modely rehetra.
  • Ny maodely data dia afaka manomboka miasa (ary mahasoa) miaraka amin'ny zavatra 2-3 fotsiny, ary avy eo mitombo tsikelikely (momba ny modely Vatofantsika Nikolai ampiharina fampitahana tsara amin'ny mycelium).
  • Ny ankamaroan'ny fanatsarana, anisan'izany ny fanitarana ny sehatry ny lohahevitra sy ny fampidirana loharano vaovao tsy misy fiantraikany amin'ny fiasa efa misy ary tsy atahorana hanimba zavatra efa miasa.
  • Noho ny fahapotehan'ny singa manara-penitra, ny fizotry ny ETL amin'ny rafitra toy izany dia mitovy, ny soratr'izy ireo dia manome algorithmization ary, amin'ny farany, MILINA.

Ny vidin'io flexibility io dia fampisehoana. Tsy midika izany fa tsy azo atao ny manatratra ny fampisehoana azo ekena amin'ny modely toy izany. Matetika kokoa noho ny tsy, mety mila ezaka bebe kokoa sy fifantohana amin'ny antsipiriany ianao mba hahatratrarana ny metrika tianao.

Apps

Karazana enti-manana Data Vault

Overview ny Agile DWH Design Methodologies

Fanazavana misimisy kokoa momba ny Data Vault:
Ny tranokalan'i Dan Lystadt
Ny momba ny Data Vault amin'ny teny Rosiana
Momba ny Data Vault amin'ny Habré

Karazana enti-manana Modely vatofantsika

Overview ny Agile DWH Design Methodologies

Fanazavana fanampiny momba ny Modely Anchor:

Tranonkalan'ny mpamorona ny Anchor Model
Lahatsoratra momba ny traikefa amin'ny fampiharana ny Modely Vatofantsika ao Avito

Tabilao famintinana miaraka amin'ny endri-javatra mahazatra sy ny fahasamihafan'ny fomba fiasa nodinihina:

Overview ny Agile DWH Design Methodologies

Source: www.habr.com

Add a comment