Podatkovne tržnice DATA VAULT

V prejšnjem članki, videli smo osnove PODATKOVNEGA SEFORA, razširitev PODATKOVNEGA SEFORA v bolj razčlenljivo stanje in ustvarjanje POSLOVNEGA SEFORA PODATKOV. Čas je, da serijo zaključimo s tretjim člankom.

Kot sem napovedal v prejšnjem publikacije, se bo ta članek osredotočil na temo BI, oziroma na pripravo DATA VAULT kot vira podatkov za BI. Poglejmo, kako ustvariti tabele dejstev in razsežnosti ter tako ustvariti zvezdno shemo.

Ko sem začel preučevati gradiva v angleškem jeziku na temo ustvarjanja podatkovnih marsov prek DATA VAULT, sem imel občutek, da je postopek precej zapleten. Ker so članki precej dolgi, obstajajo sklicevanja na spremembe besedila, ki so se pojavile v metodologiji Data Vault 2.0, je pomembnost teh besedil navedena.

Vendar, ko sem se poglobil v prevod, je postalo jasno, da ta postopek ni tako zapleten. Morda pa imate drugačno mnenje.

In tako, pojdimo k bistvu.

Tabele dimenzij in dejstev v DATA VAULT

Informacije, ki jih je najtežje razumeti:

  • Merilne tabele so zgrajene na podlagi informacij iz vozlišč in njihovih satelitov;
  • Tabele dejstev so zgrajene na podlagi informacij iz povezav in njihovih satelitov.

In to je očitno po branju članka o Osnove DATA VAULT. Vozlišča hranijo unikatne ključe poslovnih objektov, njihovi časovno vezani sateliti atributov stanja poslovnih objektov, sateliti, vezani na povezave, ki podpirajo transakcije, hranijo numerične značilnosti teh transakcij.

Tu se teorija v bistvu konča.

Kljub temu pa je po mojem mnenju treba opozoriti na nekaj konceptov, ki jih je mogoče najti v člankih o metodologiji DATA VAULT:

  • Raw Data Marts – vitrine »surovih« podatkov;
  • Information Marts - informacijske vitrine.

Koncept "Raw Data Marts" - označuje marte, zgrajene nad podatki DATA VAULT z izvajanjem dokaj preprostih JOIN-ov. Pristop »Raw Data Marts« vam omogoča fleksibilno in hitro razširitev projekta skladišča z informacijami, primernimi za analizo. Ta pristop ne vključuje izvajanja zapletenih transformacij podatkov in izvajanja poslovnih pravil, preden se postavijo v trgovino, vendar morajo biti podatki Raw Data Marts razumljivi poslovnemu uporabniku in morajo služiti kot osnova za nadaljnje transformacije, na primer z orodji BI. .

Koncept "Information Marts" se je pojavil v metodologiji Data Vault 2.0 in je nadomestil stari koncept "Data Marts". Ta sprememba je posledica realizacije naloge implementacije podatkovnega modela za poročanje kot pretvorbo podatkov v informacijo. Shema »Information Marts« naj bi podjetju v prvi vrsti zagotovila informacije, primerne za odločanje.

Precej besedne definicije odražajo dve preprosti dejstvi:

  1. Vitrine tipa “Raw Data Marts” so zgrajene na neobdelanem (RAW) DATA VAULT, repozitoriju, ki vsebuje samo osnovne pojme: HUB, POVEZAVE, SATELITI;
  2. Vitrine "Information Marts" so zgrajene z elementi POSLOVNEGA TEZORA: JAMA, MOSTOVA.

Če se obrnemo na primere shranjevanja podatkov o zaposlenem, lahko rečemo, da je izložba, ki prikazuje trenutno (trenutno) telefonsko številko zaposlenega, trgovina tipa “Raw Data Marts”. Za oblikovanje takšne vitrine se uporabljata poslovni ključ zaposlenega in funkcija MAX(), ki se uporablja na satelitskem atributu datuma nalaganja (MAX(SatLoadDate)). Ko je potrebno shraniti zgodovino sprememb atributov v izložbi - uporablja se, morate razumeti, od katerega do katerega datuma je bil telefon posodobljen, sestavo poslovnega ključa in datum nalaganja na satelit. bo taki tabeli dodal primarni ključ, dodano je tudi polje končnega datuma obdobja veljavnosti.

Ustvarjanje izložbe, ki shranjuje posodobljene informacije za vsak atribut več satelitov, vključenih v vozlišče, na primer telefonsko številko, naslov, polno ime, pomeni uporabo tabele PIT, prek katere je enostavno dostopati do vseh datumov pomembnosti. Tovrstne vitrine se imenujejo "informacijske tržnice".

Oba pristopa sta pomembna tako za meritve kot za dejstva.

Za ustvarjanje izložb, ki hranijo informacije o več povezavah in vozliščih, je mogoče uporabiti dostop do tabel BRIDGE.

S tem člankom zaključujem serijo o konceptu DATA VAULT, upam, da bodo informacije, ki sem jih delil, koristne pri izvajanju vaših projektov.

Kot vedno, za zaključek nekaj uporabnih povezav:

  • Članek Kenta Graziano, ki poleg podrobnega opisa vsebuje modelne diagrame;

Vir: www.habr.com

Dodaj komentar