Data maart DATA VAULT

In vorige artikels, is ons bekendgestel aan die basiese beginsels van DATA VAULT, die uitbreiding van DATA VAULT na 'n meer geskikte toestand vir analise, en die skep van 'n BESIGHEIDSDATA VAULT. Dit is tyd om die reeks af te sluit met die derde artikel.

Soos ek in die vorige aangekondig het Publication, sal hierdie artikel gewy word aan die onderwerp van BI, of eerder die voorbereiding van DATA VAULT as 'n databron vir BI. Kom ons kyk hoe om feite- en dimensietabelle te skep en sodoende 'n sterskema te skep.

Toe ek Engelstalige materiaal begin bestudeer het oor die skep van datamars oor DATA VAULT, het ek die gevoel gekry dat die proses nogal ingewikkeld was. Aangesien die artikels van 'n indrukwekkende grootte is, is daar verwysings na veranderinge in bewoording wat in die Data Vault 2.0 metodologie verskyn het, en die belangrikheid van hierdie bewoordings word aangedui.

Nadat ons egter in die vertaling gedelf het, het dit duidelik geword dat hierdie proses nie so ingewikkeld is nie. Maar miskien sal jy 'n ander mening hê.

So, kom ons kom by die punt.

Dimensie- en feitetabelle in DATA VAULT

Die moeilikste inligting om te verstaan:

  • Meettabelle is gebou op inligting van spilpunte en hul satelliete;
  • Feitetabelle is gebou op inligting vanaf skakels en hul satelliete.

En dit is duidelik na die lees van die artikel oor basiese beginsels van DATA VAULT. Hubs stoor unieke sleutels van besigheidsobjekte, hul satelliete van die toestand van eienskappe van besigheidsobjekte is aan tyd gekoppel, satelliete wat gekoppel is aan skakels wat transaksies ondersteun, stoor die numeriese kenmerke van hierdie transaksies.

Dit is waar die teorie basies eindig.

Maar na my mening is dit egter nodig om op 'n paar konsepte te let wat in artikels oor die DATA VAULT-metodologie kan voorkom:

  • Raw Data Marts – vertoonvensters van “rou” data;
  • Inligting Marts – inligting vertoonvensters.

Die konsep van "Raw Data Marts" verwys na vertoonvensters wat oor DATA VAULT-data gebou is deur redelik eenvoudige JOINs uit te voer. Die "Raw Data Marts"-benadering stel jou in staat om 'n pakhuisprojek buigsaam en vinnig uit te brei met inligting wat geskik is vir ontleding. Hierdie benadering impliseer nie komplekse datatransformasies en uitvoering van besigheidsreëls voor plasing in die vertoonkas nie, maar die “Raw Data Marts”-data moet verstaanbaar wees vir die besigheidsgebruiker en is bedoel om as basis te dien vir verdere transformasie, bv. met BI-gereedskap.

Die konsep van "Inligting Marts" verskyn in die Data Vault 2.0 metodologie, dit vervang die ou konsep van "Data Marts". Hierdie verandering is te danke aan die bewustheid van die taak om 'n datamodel vir die bou van verslae te implementeer as die omskakeling van data in inligting. Die Information Marts-skema behoort eerstens aan besighede inligting te verskaf wat geskik is vir besluitneming.

Die taamlik verbose definisies weerspieël twee eenvoudige feite:

  1. Uitstallings soos "Raw Data Marts" is gebou op 'n rou (RAW) DATA VAULT, 'n berging wat slegs basiese konsepte bevat: HUBS, LINKS, SATELLIETE;
  2. "Information Marts"-uitstallings word gebou met BUSINESS VULT-elemente: PIT, BRIDGE.

As ons kyk na voorbeelde van die berging van inligting oor 'n werknemer, kan ons sê dat 'n vertoonvenster wat die huidige (geldig vir vandag) telefoonnommer van 'n werknemer vertoon, 'n vertoonvenster van die "Raw Data Marts"-tipe is. Om so 'n vertoonvenster te skep, word die werknemer se besigheidsleutel en die MAX()-funksie, wat op die satellietlaaidatum-kenmerk (MAX(SatLoadDate)) gebruik word, gebruik. Wanneer dit nodig is om die geskiedenis van kenmerkveranderinge in die winkelfront te stoor - dit word gebruik, jy moet verstaan ​​vanaf watter datum die telefoon relevant was, die primêre sleutel van so 'n tabel sal 'n samestelling van die besigheidsleutel en die datum van oplaai na die satelliet, en die einddatumveld van die relevansieperiode word ook bygevoeg.

Die skep van 'n winkelfront wat huidige inligting stoor vir elke kenmerk van verskeie satelliete wat in die spilpunt ingesluit is, byvoorbeeld telefoonnommer, adres, volle naam, behels die gebruik van 'n PIT-tabel, deur toegang te verkry tot wat dit maklik is om alle relevante datums te verkry. Uitstalkaste van hierdie tipe word na verwys as "Inligting Marts".

Beide benaderings is relevant vir beide metings en feite.

Om winkelfronte te skep wat inligting oor verskeie skakels en spilpunte stoor, kan toegang tot BRIDGE-tabelle gebruik word.

Met hierdie artikel voltooi ek die reeks oor die DATA VAULT-konsep; Ek hoop dat die inligting wat ek gedeel het nuttig sal wees in die implementering van jou projekte.

Soos altyd, ten slotte, 'n paar nuttige skakels:

  • artikel Kenta Graziano, wat, benewens 'n gedetailleerde beskrywing, modeldiagramme bevat;

Bron: will.com

Voeg 'n opmerking