Data marts DATA VAULT

I tidligere artikler, vi har set det grundlæggende i DATA VAULT, udvide DATA VAULT til en mere parserbar tilstand og skabe en BUSINESS DATA VAULT. Det er tid til at afslutte serien med den tredje artikel.

Som jeg meddelte i forrige Offentliggørelse, vil denne artikel fokusere på emnet BI, eller rettere forberedelsen af ​​DATA VAULT som datakilde til BI. Lad os se på, hvordan man opretter fakta- og dimensionstabeller og dermed opretter et stjerneskema.

Da jeg begyndte at studere engelsksprogede materialer om emnet at skabe data marts over DATA VAULT, havde jeg en fornemmelse af, at processen var ret kompliceret. Da artiklerne er af betydelig længde, er der henvisninger til ændringer i ordlyden, som optrådte i Data Vault 2.0-metoden, betydningen af ​​disse formuleringer er angivet.

Men efter at have dykket ned i oversættelsen blev det klart, at denne proces ikke er så kompliceret. Men du har måske en anden mening.

Og så lad os komme til sagen.

Dimensions- og faktatabeller i DATA VAULT

Den sværeste information at forstå:

  • Måletabeller er bygget på information fra hubs og deres satellitter;
  • Faktatabeller er bygget på information fra links og deres satellitter.

Og det er tydeligt efter at have læst artiklen om Grundlæggende om DATA VAULT. Hubs gemmer unikke nøgler til forretningsobjekter, deres tidsbundne satellitter af status for forretningsobjektattributter, satellitter bundet til links, der understøtter transaktioner, gemmer de numeriske karakteristika for disse transaktioner.

Det er her teorien grundlæggende ender.

Men ikke desto mindre er det efter min mening nødvendigt at bemærke et par begreber, der kan findes i artikler om DATA VAULT-metoden:

  • Raw Data Marts - fremvisning af "rå" data;
  • Information Marts - informationsshowcases.

Konceptet "Raw Data Marts" - betegner marts bygget over DATA VAULT-data ved at udføre ret simple JOINs. "Raw Data Marts"-tilgangen giver dig mulighed for fleksibelt og hurtigt at udvide lagerprojektet med information egnet til analyse. Denne tilgang involverer ikke at udføre komplekse datatransformationer og eksekvere forretningsregler, før de placeres i butiksfronten, men Raw Data Marts-dataene bør være forståelige for forretningsbrugeren og bør tjene som grundlag for yderligere transformation, for eksempel ved hjælp af BI-værktøjer .

Konceptet "Information Marts" dukkede op i Data Vault 2.0-metoden, det erstattede det gamle koncept med "Data Marts". Denne ændring skyldes realiseringen af ​​opgaven med at implementere en datamodel for rapportering som en transformation af data til information. "Information Marts"-ordningen skal først og fremmest give virksomheden information, der er egnet til beslutningstagning.

Temmelig ordrige definitioner afspejler to simple fakta:

  1. Showcases af typen "Raw Data Marts" er bygget på en rå (RAW) DATA VAULT, et lager, der kun indeholder de grundlæggende begreber: HUBS, LINKS, SATELLITER;
  2. Showcases "Information Marts" er bygget ved hjælp af elementer fra BUSINESS VULT: PIT, BRIDGE.

Hvis vi vender os til eksempler på lagring af information om en medarbejder, kan vi sige, at en butiksfacade, der viser det aktuelle (aktuelle) telefonnummer på en medarbejder, er en butiksfacade af typen "Raw Data Marts". For at danne et sådant udstillingsvindue bruges medarbejderens forretningsnøgle og MAX()-funktionen, der bruges på satellitindlæsningsdato-attributten (MAX(SatLoadDate)). Når det er påkrævet at gemme historikken for attributændringer i udstillingsvinduet - det bruges, skal du forstå fra hvilken dato telefonen var opdateret, kompileringen af ​​forretningsnøglen og uploaddatoen til satellitten vil tilføje den primære nøgle til en sådan tabel, tilføjes feltet med slutdatoen for gyldighedsperioden også.

Oprettelse af en butiksfacade, der gemmer opdaterede oplysninger for hver egenskab af flere satellitter, der er inkluderet i hub'en, for eksempel telefonnummer, adresse, fulde navn, indebærer brugen af ​​en PIT-tabel, hvorigennem det er nemt at få adgang til alle datoer af relevans. Vitrineskabe af denne type omtales som "Information Marts".

Begge tilgange er relevante for både målinger og fakta.

For at oprette butiksfacader, der gemmer oplysninger om flere links og hubs, kan adgang til BRIDGE-tabeller involveres.

Med denne artikel fuldender jeg serien om konceptet DATA VAULT, jeg håber, at de oplysninger, jeg delte, vil være nyttige i implementeringen af ​​dine projekter.

Som altid, afslutningsvis et par nyttige links:

  • artiklen Kenta Graziano, som udover en detaljeret beskrivelse indeholder modeldiagrammer;

Kilde: www.habr.com

Tilføj en kommentar