Data marts DATA VAULT

Ankstesniame straipsnius, pamatėme DATA VAULT pagrindus, išplečiant DATA VAULT į labiau analizuojamą būseną ir sukuriant BUSINESS DATA VAULT. Atėjo laikas užbaigti seriją trečiuoju straipsniu.

Kaip skelbiau anksčiau Leidinys, šis straipsnis bus skirtas BI temai, tiksliau, DATA VAULT, kaip BI duomenų šaltinio, paruošimui. Pažiūrėkime, kaip sukurti faktų ir dimensijų lenteles ir taip sukurti žvaigždžių schemą.

Kai pradėjau studijuoti medžiagą anglų kalba duomenų rinkų kūrimo per DATA VAULT tema, pajutau, kad procesas yra gana sudėtingas. Kadangi straipsniai yra nemažos apimties, yra nuorodų į „Data Vault 2.0“ metodikoje atsiradusius formuluočių pakeitimus, nurodoma šių formuluočių svarba.

Tačiau įsigilinus į vertimą paaiškėjo, kad šis procesas nėra toks jau sudėtingas. Bet jūs galite turėti kitokią nuomonę.

Taigi, pereikime prie esmės.

Matmenų ir faktų lentelės DATA VAULT

Sunkiausiai suprantama informacija:

  • Matavimo lentelės sudaromos remiantis informacija iš koncentratorių ir jų palydovų;
  • Faktų lentelės sudaromos remiantis informacija iš nuorodų ir jų palydovų.

Ir tai akivaizdu perskaičius straipsnį apie DATA VAULT pagrindai. Centruose saugomi unikalūs verslo objektų raktai, jų verslo objektų atributų būsenos laiko satelitai, palydovai, susieti su nuorodomis, palaikančiomis operacijas, saugo skaitines šių operacijų charakteristikas.

Čia teorija iš esmės baigiasi.

Bet vis dėlto, mano nuomone, būtina atkreipti dėmesį į keletą sąvokų, kurias galima rasti straipsniuose apie DATA VAULT metodiką:

  • Raw Data Marts – „neapdorotų“ duomenų vitrinos;
  • Informaciniai martai – informacinės vitrinos.

„Raw Data Marts“ sąvoka – žymi rinkinius, sukurtus naudojant DATA VAULT duomenis, atliekant gana paprastus JOIN. „Raw Data Marts“ metodas leidžia lanksčiai ir greitai išplėsti sandėlio projektą analizei tinkama informacija. Šis metodas neapima sudėtingų duomenų transformacijų ir verslo taisyklių vykdymo prieš įtraukiant juos į parduotuvę, tačiau „Raw Data Marts“ duomenys turėtų būti suprantami verslo vartotojui ir turėtų būti pagrindas tolesniam transformavimui, pavyzdžiui, naudojant BI įrankius. .

„Data Vault 2.0“ metodikoje atsirado „Information Marts“ sąvoka, ji pakeitė senąją „Data Marts“ koncepciją. Šį pakeitimą lėmė užduotis įgyvendinti duomenų modelį ataskaitoms, kaip duomenų pavertimui informacija. Schema „Informaciniai turtai“ pirmiausia turėtų suteikti verslui sprendimams priimti tinkamą informaciją.

Gana žodiniai apibrėžimai atspindi du paprastus faktus:

  1. „Raw Data Marts“ tipo vitrinos yra sukurtos ant neapdorotų (RAW) DATA VAULT, saugyklos, kurioje yra tik pagrindinės sąvokos: HUBS, LINKS, SATELLITAS;
  2. Vitrinos „Informaciniai turtai“ pastatyti naudojant VERSLO VAULT elementus: PIT, TILTAS.

Jei pažvelgsime į informacijos apie darbuotoją saugojimo pavyzdžius, galime teigti, kad vitrinos, kuriose rodomas esamas (dabartinis) darbuotojo telefono numeris, yra „Raw Data Marts“ tipo vitrinos. Tokiai vitrinai suformuoti naudojamas darbuotojo verslo raktas ir funkcija MAX(), naudojama palydovo įkėlimo datos atribute (MAX(SatLoadDate)). Kai vitrinoje reikia saugoti atributų pasikeitimų istoriją - ji naudojama, reikia suprasti, nuo kurios datos iki kurios datos telefonas buvo atnaujintas, verslo rakto sudarymą ir įkėlimo datą. palydovas prie tokios lentelės pridės pirminį raktą, taip pat pridedamas galiojimo laikotarpio pabaigos datos laukas.

Kuriant vitriną, kurioje saugoma naujausia informacija apie kiekvieną kelių į centrą įtrauktų palydovų atributą, pvz., telefono numerį, adresą, vardą ir pavardę, reikia naudoti GPM lentelę, per kurią lengva pasiekti visas datas. aktualumo. Tokio tipo vitrinos vadinamos „Informaciniais turgais“.

Abu metodai yra svarbūs tiek matavimams, tiek faktams.

Norint sukurti parduotuvių vitrinas, kuriose saugoma informacija apie kelias nuorodas ir šakotuvus, galima naudotis prieiga prie BRIDGE lentelių.

Šiuo straipsniu užbaigiu seriją apie DATA VAULT koncepciją, tikiuosi, kad informacija, kuria pasidalinau, bus naudinga įgyvendinant jūsų projektus.

Kaip visada, pabaigai – kelios naudingos nuorodos:

  • Straipsnis Kenta Graziano, kuriame, be išsamaus aprašymo, yra modelių diagramos;

Šaltinis: www.habr.com

Добавить комментарий