Mars të dhënave DATA VAULT

Në të mëparshmen artikuj, u njohëm me bazat e DATA VAULT, duke zgjeruar DATA VAULT në një gjendje më të përshtatshme për analizë dhe duke krijuar një BUSINESS DATA VAULT. Është koha për të përfunduar serinë me artikullin e tretë.

Siç e kam njoftuar në më parë Publikim, ky artikull do t'i kushtohet temës së BI, ose më saktë përgatitjes së DATA VAULT si një burim të dhënash për BI. Le të shohim se si të krijojmë tabela faktesh dhe dimensionesh dhe në këtë mënyrë të krijojmë një skemë ylli.

Kur fillova të studioja materialet në gjuhën angleze me temën e krijimit të të dhënave marts mbi DATA VAULT, pata ndjenjën se procesi ishte mjaft i ndërlikuar. Meqenëse artikujt janë të një madhësie mbresëlënëse, ka referenca për ndryshimet në formulim që u shfaqën në metodologjinë Data Vault 2.0 dhe tregohet rëndësia e këtyre formulimeve.

Sidoqoftë, pasi u zhyt në përkthim, u bë e qartë se ky proces nuk është aq i ndërlikuar. Por ndoshta do të keni një mendim tjetër.

Pra, le të shkojmë te pika.

Tabelat e dimensioneve dhe fakteve në DATA VAULT

Informacioni më i vështirë për t'u kuptuar:

  • Tabelat e matjes janë ndërtuar mbi informacionin nga qendrat dhe satelitët e tyre;
  • Tabelat e fakteve janë ndërtuar mbi informacionin nga lidhjet dhe satelitët e tyre.

Dhe kjo është e qartë pasi të keni lexuar artikullin rreth bazat e DATA VAULT. Hubs ruajnë çelësat unikë të objekteve të biznesit, satelitët e tyre të gjendjes së atributeve të objekteve të biznesit janë të lidhur me kohën, satelitët e lidhur me lidhjet që mbështesin transaksionet ruajnë karakteristikat numerike të këtyre transaksioneve.

Këtu në thelb përfundon teoria.

Por, megjithatë, për mendimin tim, është e nevojshme të theksohen disa koncepte që mund të shfaqen në artikuj në lidhje me metodologjinë DATA VAULT:

  • Raw Data Marts – ekspozita të të dhënave “të papërpunuara”;
  • Informacioni Marts – vitrina informacioni.

Koncepti i "Raw Data Marts" i referohet ekspozitave të ndërtuara mbi të dhënat DATA VAULT duke kryer JOIN mjaft të thjeshta. Qasja "Raw Data Marts" ju lejon të zgjeroni në mënyrë fleksibël dhe të shpejtë një projekt magazinë me informacion të përshtatshëm për analizë. Kjo qasje nuk përfshin kryerjen e transformimeve komplekse të të dhënave dhe ekzekutimin e rregullave të biznesit përpara vendosjes së tyre në vitrinë, megjithatë, të dhënat "Raw Data Marts" duhet të jenë të kuptueshme për përdoruesin e biznesit dhe të synojnë të shërbejnë si bazë për transformim të mëtejshëm, për shembull, me mjetet BI.

Koncepti i "Information Marts" u shfaq në metodologjinë Data Vault 2.0, ai zëvendësoi konceptin e vjetër të "Data Marts". Ky ndryshim është për shkak të ndërgjegjësimit për detyrën e zbatimit të një modeli të dhënash për ndërtimin e raporteve si konvertimi i të dhënave në informacion. Skema e Informacionit Marts, para së gjithash, duhet t'i sigurojë bizneseve informacion të përshtatshëm për vendimmarrje.

Përkufizimet mjaft të thukëta pasqyrojnë dy fakte të thjeshta:

  1. Vitrinat si "Raw Data Marts" janë ndërtuar mbi një DATA VAULT të papërpunuar (RAW), një hapësirë ​​ruajtëse që përmban vetëm konceptet bazë: HUBS, LIDHJE, SATELITËT;
  2. Vitrinat "Information Marts" janë ndërtuar duke përdorur elementë BUSINESS VAULT: PIT, BRIDGE.

Nëse shikojmë shembuj të ruajtjes së informacionit për një punonjës, mund të themi se një vitrinë që shfaq numrin aktual (i vlefshëm për sot) të telefonit të një punonjësi është një vitrinë e llojit "Raw Data Marts". Për të krijuar një vitrinë të tillë, përdoren çelësi i biznesit të punonjësit dhe funksioni MAX(), i përdorur në atributin e datës së ngarkimit të satelitit (MAX(SatLoadDate)). Kur është e nevojshme të ruhet historia e ndryshimeve të atributeve në vitrinën - përdoret, duhet të kuptoni se nga cila datë telefoni ishte i rëndësishëm, çelësi kryesor i një tabele të tillë do të jetë një përmbledhje e çelësit të biznesit dhe datës së ngarkoni në satelit dhe shtohet edhe fusha e datës së përfundimit të periudhës përkatëse.

Krijimi i një vitrinëje që ruan informacionin aktual për çdo atribut të disa satelitëve të përfshirë në qendër, për shembull, numrin e telefonit, adresën, emrin e plotë, përfshin përdorimin e një tabele PIT, duke hyrë në të cilën është e lehtë të merren të gjitha datat përkatëse. Vitrinat e këtij lloji quhen "Information Marts".

Të dyja qasjet janë të rëndësishme si për matjet ashtu edhe për faktet.

Për të krijuar vitrina që ruajnë informacione për disa lidhje dhe shpërndarës, mund të përdoret qasja në tabelat BRIDGE.

Me këtë artikull unë plotësoj serinë mbi konceptin DATA VAULT; shpresoj se informacioni që kam ndarë do të jetë i dobishëm në zbatimin e projekteve tuaja.

Si gjithmonë, në përfundim, disa lidhje të dobishme:

  • artikull Kenta Graziano, e cila, përveç një përshkrimi të detajuar, përmban diagrame modele;

Burimi: www.habr.com

Shto një koment