Data mars DATA VALV

I forrige artikler, ble vi introdusert til det grunnleggende om DATA VALT, utvidet DATA VALLT til en mer egnet tilstand for analyse, og opprettet et BUSINESS DATA VALT. Det er på tide å avslutte serien med den tredje artikkelen.

Som jeg kunngjorde i forrige publikasjon, vil denne artikkelen være viet til temaet BI, eller snarere utarbeidelsen av DATA VAULT som en datakilde for BI. La oss se på hvordan du lager fakta- og dimensjonstabeller og dermed lager et stjerneskjema.

Da jeg begynte å studere engelskspråklig materiale om temaet å lage datamarts over DATA VAULT, fikk jeg følelsen av at prosessen var ganske komplisert. Siden artiklene er av en imponerende størrelse, er det referanser til endringer i ordlyden som dukket opp i Data Vault 2.0-metodikken, og viktigheten av disse formuleringene er indikert.

Etter å ha fordypet seg i oversettelsen, ble det imidlertid klart at denne prosessen ikke er så komplisert. Men kanskje du har en annen oppfatning.

Så la oss komme til poenget.

Dimensjons- og faktatabeller i DATA VALT

Den vanskeligste informasjonen å forstå:

  • Måletabeller er bygget på informasjon fra huber og deres satellitter;
  • Faktatabeller er bygget på informasjon fra lenker og deres satellitter.

Og dette er åpenbart etter å ha lest artikkelen om grunnleggende om DATA VAULT. Huber lagrer unike nøkler til forretningsobjekter, satellittene deres for tilstanden til attributter til forretningsobjekter er bundet til tid, satellitter knyttet til lenker som støtter transaksjoner lagrer de numeriske egenskapene til disse transaksjonene.

Det er her teorien i utgangspunktet slutter.

Men likevel, etter min mening, er det nødvendig å merke seg et par konsepter som kan vises i artikler om DATA VAULT-metodikken:

  • Raw Data Marts – utstillingsvinduer av "rå" data;
  • Information Marts – informasjonsutstillinger.

Konseptet "Raw Data Marts" refererer til utstillingsvinduer bygget over DATA VAULT-data ved å utføre ganske enkle JOINs. "Raw Data Marts"-tilnærmingen lar deg fleksibelt og raskt utvide et lagerprosjekt med informasjon egnet for analyse. Denne tilnærmingen innebærer ikke å utføre komplekse datatransformasjoner og utføre forretningsregler før de plasseres i butikkfronten, men «Raw Data Marts»-dataene bør være forståelige for forretningsbrukeren og ment å tjene som grunnlag for videre transformasjon, for eksempel, med BI-verktøy.

Konseptet "Information Marts" dukket opp i Data Vault 2.0-metodikken, det erstattet det gamle konseptet "Data Marts". Denne endringen skyldes bevisstheten om oppgaven med å implementere en datamodell for å bygge rapporter som konvertering av data til informasjon. Informasjonsmart-ordningen skal for det første gi bedrifter informasjon som egner seg for beslutningstaking.

De ganske detaljerte definisjonene gjenspeiler to enkle fakta:

  1. Utstillingsvinduer som "Raw Data Marts" er bygget på en rå (RAW) DATA VAULT, en lagring som kun inneholder grunnleggende konsepter: HUBS, LINKER, SATELLITER;
  2. «Information Marts»-utstillingsvinduer er bygget ved hjelp av BUSINESS VULT-elementer: PIT, BRIDGE.

Hvis vi ser på eksempler på lagring av informasjon om en ansatt, kan vi si at et utstillingsvindu som viser gjeldende (gyldig for i dag) telefonnummeret til en ansatt er et utstillingsvindu av typen «Raw Data Marts». For å lage et slikt utstillingsvindu, brukes den ansattes forretningsnøkkel og MAX()-funksjonen, brukt på attributtet for satellittlastingsdato (MAX(SatLoadDate)). Når det er nødvendig å lagre historikken for attributtendringer i butikkfronten - den brukes, må du forstå fra hvilken dato telefonen var relevant, primærnøkkelen til en slik tabell vil være en samling av forretningsnøkkelen og datoen for last opp til satellitten, og sluttdatofeltet for relevansperioden legges også til.

Å lage en butikkfront som lagrer gjeldende informasjon for hver attributt til flere satellitter som er inkludert i huben, for eksempel telefonnummer, adresse, fullt navn, innebærer bruk av en PIT-tabell, ved å få tilgang til denne er det enkelt å få tak i alle relevante datoer. Showcases av denne typen blir referert til som "Information Marts".

Begge tilnærmingene er relevante for både målinger og fakta.

For å lage butikkfronter som lagrer informasjon om flere lenker og huber, kan tilgang til BRIDGE-tabeller brukes.

Med denne artikkelen fullfører jeg serien om DATA VAULT-konseptet; Jeg håper informasjonen jeg delte vil være nyttig i implementeringen av prosjektene dine.

Som alltid, avslutningsvis, noen nyttige linker:

  • artikkel Kent Graziano, som i tillegg til en detaljert beskrivelse inneholder diagrammer av modellen;

Kilde: www.habr.com

Legg til en kommentar