Skladište podataka DATA VAULT

U prethodnom članci, vidjeli smo osnove TRŽIŠTA PODATAKA, proširenje TRŽIŠTA PODATAKA na stanje koje se može analizirati i kreiranje TRŽIŠTA POSLOVNIH PODATAKA. Vrijeme je da seriju završimo trećim člankom.

Kao što sam i najavio u prethodnom publikacije, ovaj članak će se fokusirati na temu BI, odnosno pripremu DATA VAULT-a kao izvora podataka za BI. Pogledajmo kako da kreiramo tabele činjenica i dimenzija i tako kreiramo zvjezdastu šemu.

Kada sam počeo da proučavam materijale na engleskom jeziku na temu kreiranja data marta preko DATA VAULT-a, imao sam osećaj da je proces prilično komplikovan. Budući da su članci velike dužine, postoje reference na promjene u formulacijama koje su se pojavile u metodologiji Data Vault 2.0, ukazuje se na važnost ovih formulacija.

Međutim, udubivši se u prijevod, postalo je jasno da ovaj proces nije tako komplikovan. Ali možda imate drugačije mišljenje.

I tako, da pređemo na stvar.

Tablice dimenzija i činjenica u SREZU PODATAKA

Najteže informacije za razumevanje:

  • Tablice mjerenja su izgrađene na osnovu informacija sa čvorišta i njihovih satelita;
  • Tabele činjenica su izgrađene na osnovu informacija sa linkova i njihovih satelita.

A to je očigledno nakon čitanja članka o Osnove TRZOVA PODATAKA. Čvorišta pohranjuju jedinstvene ključeve poslovnih objekata, njihove vremenski ograničene satelite stanja atributa poslovnog objekta, satelite vezane za veze koje podržavaju transakcije pohranjuju numeričke karakteristike ovih transakcija.

Tu se teorija u osnovi završava.

No, ipak, po mom mišljenju, potrebno je napomenuti nekoliko koncepata koji se mogu naći u člancima o metodologiji DATA VAULT:

  • Raw Data Marts - vitrine "sirovih" podataka;
  • Informacijski vitrine - informativni vitrine.

Koncept "Raw Data Marts" - označava marte izgrađene preko podataka TRŽIŠTA PODATAKA izvođenjem prilično jednostavnih JOIN-ova. Pristup “Raw Data Marts” omogućava vam da fleksibilno i brzo proširite projekat skladišta informacijama pogodnim za analizu. Ovaj pristup ne uključuje izvođenje složenih transformacija podataka i izvršavanje poslovnih pravila prije stavljanja u izlog, međutim, podaci Raw Data Marts-a trebali bi biti razumljivi poslovnom korisniku i trebali bi poslužiti kao osnova za dalju transformaciju, na primjer, pomoću BI alata .

Koncept „Informacionih Mart“ pojavio se u metodologiji Data Vault 2.0, zamenio je stari koncept „Data Marts“. Ova promjena je posljedica realizacije zadatka implementacije modela podataka za izvještavanje kao transformacije podataka u informaciju. Šema “Informacijskih prodajnih mjesta”, prije svega, treba da pruži biznisu informacije pogodne za donošenje odluka.

Prilično raznorodne definicije odražavaju dvije jednostavne činjenice:

  1. Vitrine tipa “Raw Data Marts” su izgrađene na neobrađenom (RAW) SREŽU PODATAKA, spremištu koje sadrži samo osnovne koncepte: HUBS, LINKOVI, SATELITI;
  2. Vitrine "Informaciona vitrina" izgrađene su od elemenata POSLOVNOG TRAKA: JAMA, MOST.

Ako se okrenemo primjerima pohranjivanja informacija o zaposleniku, možemo reći da je izlog koji prikazuje trenutni (trenutni) telefonski broj zaposlenika izlog tipa “Raw Data Marts”. Za formiranje takvog prikaza koriste se poslovni ključ zaposlenika i funkcija MAX() koja se koristi na atributu datuma učitavanja satelita (MAX(SatLoadDate)). Kada je potrebno pohraniti historiju promjena atributa u izlog - koristi se, potrebno je razumjeti od kog datuma je telefon bio ažuran, kompilaciju poslovnog ključa i datum upload-a na satelit će takvoj tabeli dodati primarni ključ, dodaje se i polje datuma završetka perioda važenja.

Kreiranje izloga koji pohranjuje ažurirane informacije za svaki atribut nekoliko satelita uključenih u čvorište, na primjer, broj telefona, adresa, puno ime, podrazumijeva korištenje PIT tabele, preko koje je lako pristupiti svim datumima relevantnosti. Vitrine ovog tipa nazivaju se „Informacioni centri“.

Oba pristupa su relevantna i za mjerenja i za činjenice.

Za kreiranje izloga koji pohranjuju informacije o nekoliko veza i čvorišta, može se koristiti pristup BRIDGE tabelama.

Ovim člankom završavam seriju o konceptu DATA VAULT-a, nadam se da će informacije koje sam podijelio biti korisne u implementaciji vaših projekata.

Kao i uvijek, u zaključku, nekoliko korisnih linkova:

  • Članak Kenta Graziano, koji pored detaljnog opisa sadrži modelske dijagrame;

izvor: www.habr.com

Dodajte komentar