Trgovine podacima DATA VAULT

U prethodnim članci, vidjeli smo osnove DATA VAULT-a, proširenje DATA VAULT-a u stanje koje je bolje raščlaniti i stvaranje BUSINESS DATA VAULT-a. Vrijeme je da trećim člankom završimo serijal.

Kao što sam najavio u prethodnom Publikacija, ovaj članak će se fokusirati na temu BI, odnosno pripremu DATA VAULT-a kao izvora podataka za BI. Pogledajmo kako izraditi tablice činjenica i dimenzija i tako stvoriti zvjezdanu shemu.

Kad sam počeo proučavati materijale na engleskom jeziku na temu stvaranja martova podataka preko DATA VAULT-a, imao sam osjećaj da je proces prilično kompliciran. Budući da su članci prilično dugački, postoje reference na promjene u formulacijama koje su se pojavile u metodologiji Data Vault 2.0, važnost ovih formulacija je naznačena.

Međutim, udubivši se u prijevod, postalo je jasno da taj proces nije tako kompliciran. Ali možda imate drugačije mišljenje.

I tako, prijeđimo na stvar.

Tablice dimenzija i činjenica u DATA VAULT-u

Informacije koje je najteže razumjeti:

  • Mjerne tablice izgrađene su na temelju informacija iz čvorišta i njihovih satelita;
  • Tablice činjenica izgrađene su na temelju informacija s veza i njihovih satelita.

I to je očito nakon čitanja članka o Osnove DATA VAULT-a. Hubovi pohranjuju jedinstvene ključeve poslovnih objekata, njihovi vremenski ograničeni sateliti stanja atributa poslovnog objekta, sateliti vezani uz poveznice koje podržavaju transakcije pohranjuju numeričke karakteristike tih transakcija.

Tu teorija u biti završava.

No, ipak, po mom mišljenju, potrebno je napomenuti nekoliko koncepata koji se mogu pronaći u člancima o metodologiji DATA VAULT:

  • Raw Data Marts - vitrine "sirovih" podataka;
  • Information Marts - informativne vitrine.

Koncept "Raw Data Marts" - označava marte izgrađene nad podacima DATA VAULT izvođenjem prilično jednostavnih JOIN-ova. Pristup “Raw Data Marts” omogućuje vam fleksibilno i brzo proširenje skladišnog projekta informacijama prikladnim za analizu. Ovaj pristup ne uključuje izvođenje složenih transformacija podataka i izvršavanje poslovnih pravila prije postavljanja u izlog, međutim, podaci Raw Data Marts trebaju biti razumljivi poslovnom korisniku i trebali bi služiti kao temelj za daljnju transformaciju, na primjer, pomoću BI alata .

Koncept “Information Marts” pojavio se u metodologiji Data Vault 2.0, zamijenio je stari koncept “Data Marts”. Ova promjena je posljedica realizacije zadaće implementacije podatkovnog modela za izvješćivanje kao transformacije podataka u informaciju. Shema “Information Marts” bi prije svega trebala poduzeću pružiti informacije prikladne za donošenje odluka.

Prilično složene definicije odražavaju dvije jednostavne činjenice:

  1. Izlozi tipa “Raw Data Marts” izgrađeni su na neobrađenom (RAW) DATA VAULT-u, repozitoriju koji sadrži samo osnovne pojmove: HUB-ovi, LINKOVI, SATELITI;
  2. Vitrine "Information Marts" izgrađene su korištenjem elemenata POSLOVNOG SVEZA: JAMA, MOSTOVA.

Ako se okrenemo primjerima pohranjivanja podataka o zaposleniku, možemo reći da je izlog koji prikazuje trenutačni (trenutni) telefonski broj zaposlenika izlog tipa “Raw Data Marts”. Za formiranje takvog izloga koristi se poslovni ključ zaposlenika i funkcija MAX() koja se koristi na atributu datuma učitavanja satelita (MAX(SatLoadDate)). Kada je potrebno pohraniti povijest promjena atributa u izložbi - koristi se, morate razumjeti od kojeg do kojeg datuma je telefon bio ažuriran, kompilaciju poslovnog ključa i datum učitavanja na satelit. će takvoj tablici dodati primarni ključ, dodaje se i polje krajnjeg datuma roka valjanosti.

Stvaranje izloga koji pohranjuje ažurne podatke za svaki atribut nekoliko satelita uključenih u čvorište, na primjer, broj telefona, adresu, puno ime, podrazumijeva korištenje PIT tablice, putem koje je lako pristupiti svim datumima od relevantnosti. Izlozi ovog tipa nazivaju se "Informacijski marti".

Oba su pristupa relevantna i za mjerenja i za činjenice.

Za izradu izloga koji pohranjuju informacije o nekoliko veza i čvorišta, može se uključiti pristup tablicama BRIDGE.

Ovim člankom dovršavam seriju o konceptu DATA VAULT, nadam se da će informacije koje sam podijelio biti korisne u provedbi vaših projekata.

Kao i uvijek, na kraju nekoliko korisnih linkova:

  • članak Kenta Graziano, koji osim detaljnog opisa sadrži dijagrame modela;

Izvor: www.habr.com

Dodajte komentar