Data marts DATA VAULT

IepriekŔējā rakstus, mēs esam redzējuÅ”i DATA VAULT pamatus, paplaÅ”inot DATA VAULT lÄ«dz parsējamākam stāvoklim un izveidojot BIZNESA DATU VAULT. Ir pienācis laiks beigt sēriju ar treÅ”o rakstu.

Kā jau paziņoju iepriekŔējā PublicÄ“Å”ana, Å”ajā rakstā galvenā uzmanÄ«ba tiks pievērsta BI tēmai vai drÄ«zāk DATA VAULT kā BI datu avota sagatavoÅ”anai. ApskatÄ«sim, kā izveidot faktu un dimensiju tabulas un tādējādi izveidot zvaigžņu shēmu.

Kad sāku studēt angļu valodas materiālus par datu martu izveidi, izmantojot DATA VAULT, man radās sajÅ«ta, ka process ir diezgan sarežģīts. Tā kā raksti ir ievērojama garuma, ir atsauces uz izmaiņām formulējumā, kas parādÄ«jās Data Vault 2.0 metodoloÄ£ijā, tiek norādÄ«ta Å”o formulējumu nozÄ«me.

Taču, iedziļinoties tulkojumā, kļuva skaidrs, ka Ŕis process nemaz nav tik sarežģīts. Bet jums var būt atŔķirīgs viedoklis.

Un tā, ķersimies pie lietas.

Izmēru un faktu tabulas pakalpojumā DATA VAULT

Visgrūtāk saprotamā informācija:

  • MērÄ«jumu tabulas ir veidotas, pamatojoties uz informāciju no centrmezgliem un to satelÄ«tiem;
  • Faktu tabulas ir veidotas, pamatojoties uz informāciju no saitēm un to satelÄ«tiem.

Un tas ir acÄ«mredzams pēc raksta izlasÄ«Å”anas par DATA VAULT pamati. Centrmezglos tiek glabātas unikālas biznesa objektu atslēgas, to laika ierobežotie biznesa objektu atribÅ«tu stāvokļa satelÄ«ti, satelÄ«ti, kas saistÄ«ti ar saitēm, kas atbalsta darÄ«jumus, glabā Å”o darÄ«jumu skaitliskos raksturlielumus.

Šeit teorija būtībā beidzas.

Bet tomēr, manuprāt, ir jāatzīmē pāris jēdzieni, kas atrodami rakstos par DATA VAULT metodoloģiju:

  • Raw Data Marts - "neapstrādātu" datu vitrÄ«nas;
  • Informācija Marts - informācijas vitrÄ«nas.

Jēdziens "Raw Data Marts" ā€” apzÄ«mē marts, kas izveidoti, izmantojot DATA VAULT datus, veicot diezgan vienkārÅ”us JOIN. ā€œRaw Data Martsā€ pieeja ļauj elastÄ«gi un ātri paplaÅ”ināt noliktavas projektu ar analÄ«zei piemērotu informāciju. Å Ä« pieeja neietver sarežģītu datu transformāciju veikÅ”anu un biznesa noteikumu izpildi pirms ievietoÅ”anas veikalā, tomēr Raw Data Marts datiem ir jābÅ«t saprotamiem biznesa lietotājam un jākalpo par pamatu tālākai transformācijai, piemēram, ar BI rÄ«kiem. .

ā€œInformācijas Martsā€ jēdziens parādÄ«jās Data Vault 2.0 metodoloÄ£ijā, tas aizstāja veco ā€œData Martsā€ jēdzienu. Å Ä«s izmaiņas ir saistÄ«tas ar uzdevuma realizāciju datu modelim ziņoÅ”anai kā datu pārveidoÅ”anai informācijā. Shēmai ā€œInformācijas Martsā€, pirmkārt, ir jāsniedz biznesam lēmumu pieņemÅ”anai piemērota informācija.

Diezgan vārgas definīcijas atspoguļo divus vienkārŔus faktus:

  1. ā€œRaw Data Martsā€ tipa vitrÄ«nas ir veidotas uz neapstrādātu (RAW) DATA VAULT, repozitorija, kurā ir tikai pamatjēdzieni: centrmezgli, SAITES, SATELÄŖTI;
  2. Vitrīnas "Informācijas Marts" ir veidotas, izmantojot BIZNESA VELVES elementus: PIT, BRIDGE.

Ja pievērÅ”amies piemēriem informācijas glabāŔanai par darbinieku, varam teikt, ka veikala mājaslapa, kurā redzams darbinieka paÅ”reizējais (paÅ”reizējais) tālruņa numurs, ir ā€œRaw Data Martsā€ tipa veikala mājaslapa. Lai izveidotu Ŕādu vitrÄ«nu, tiek izmantota darbinieka biznesa atslēga un funkcija MAX(), kas tiek izmantota satelÄ«ta ielādes datuma atribÅ«tā (MAX(SatLoadDate)). Kad vitrÄ«nā ir jāsaglabā atribÅ«tu izmaiņu vēsture - tas tiek izmantots, jums ir jāsaprot, no kura datuma tālrunis bija atjaunināts, biznesa atslēgas apkopoÅ”ana un augÅ”upielādes datums satelÄ«tā pievienos Ŕādai tabulai primāro atslēgu, tiek pievienots arÄ« derÄ«guma termiņa beigu datuma lauks.

Lai izveidotu veikalu, kurā tiek glabāta jaunākā informācija par katru vairāku centrmezglā iekļauto satelītu atribūtu, piemēram, tālruņa numuru, adresi, pilnu vārdu, tiek izmantota IIN tabula, caur kuru ir viegli piekļūt visiem datumiem. nozīmes. Šāda veida vitrīnas tiek dēvētas par "Informācijas martiem".

Abas pieejas ir svarīgas gan mērījumiem, gan faktiem.

Lai izveidotu veikalu fasādes, kurās tiek glabāta informācija par vairākām saitēm un centrmezgliem, var izmantot piekļuvi tabulām BRIDGE.

Ar Å”o rakstu es pabeidzu sēriju par DATA VAULT koncepciju, ceru, ka informācija, ar kuru dalÄ«jos, noderēs jÅ«su projektu Ä«stenoÅ”anā.

Kā vienmēr, noslēgumā dažas noderīgas saites:

  • Pants Kenta Graziano, kas papildus detalizētam aprakstam satur modeļu diagrammas;

Avots: www.habr.com

Pievieno komentāru