Datamarts DATA VAULT

In de vorige Lidwoord, hebben we de basisprincipes van DATA VAULT gezien, het uitbreiden van DATA VAULT naar een meer ontleedbare staat en het creëren van een BUSINESS DATA VAULT. Het is tijd om de serie te beëindigen met het derde artikel.

Zoals ik in het vorige aankondigde Uitgave, zal dit artikel zich richten op het onderwerp BI, of beter gezegd de voorbereiding van DATA VAULT als gegevensbron voor BI. Laten we eens kijken hoe we feiten- en dimensietabellen kunnen maken en zo een sterschema kunnen maken.

Toen ik Engelstalig materiaal begon te bestuderen over het maken van datamarts via DATA VAULT, had ik het gevoel dat het proces nogal ingewikkeld was. Aangezien de artikelen behoorlijk lang zijn, er verwijzingen zijn naar wijzigingen in de bewoordingen die in de Data Vault 2.0-methodologie zijn verschenen, wordt het belang van deze bewoordingen aangegeven.

Nadat ik me echter in de vertaling had verdiept, werd het duidelijk dat dit proces niet zo ingewikkeld is. Maar misschien heb jij een andere mening.

En dus, laten we ter zake komen.

Dimensie- en feitentabellen in DATA VAULT

De moeilijkste informatie om te begrijpen:

  • Meettabellen zijn gebaseerd op informatie van hubs en hun satellieten;
  • Feitentabellen zijn gebaseerd op informatie van links en hun satellieten.

En dit is duidelijk na het lezen van het artikel over DATA VAULT-basisprincipes. Hubs slaan unieke sleutels van bedrijfsobjecten op, hun tijdgebonden satellieten van de status van bedrijfsobjectattributen, satellieten die zijn gekoppeld aan links die transacties ondersteunen, slaan de numerieke kenmerken van deze transacties op.

Dit is waar de theorie eigenlijk eindigt.

Maar toch is het naar mijn mening noodzakelijk om een ​​aantal concepten op te merken die te vinden zijn in artikelen over de DATA VAULT-methodologie:

  • Raw Data Marts - showcases van "ruwe" gegevens;
  • Informatiemarts - informatievitrines.

Het concept van "Raw Data Marts" - geeft marts aan die zijn gebouwd op DATA VAULT-gegevens door vrij eenvoudige JOINs uit te voeren. De “Raw Data Marts”-benadering stelt u in staat om het magazijnproject flexibel en snel uit te breiden met informatie die geschikt is voor analyse. Deze aanpak omvat niet het uitvoeren van complexe datatransformaties en het uitvoeren van bedrijfsregels voordat ze in de winkel worden geplaatst, maar de Raw Data Marts-gegevens moeten begrijpelijk zijn voor de zakelijke gebruiker en dienen als basis voor verdere transformatie, bijvoorbeeld door BI-tools .

Het concept van "Information Marts" verscheen in de Data Vault 2.0-methodiek en verving het oude concept van "Datamarts". Deze verandering is het gevolg van de realisatie van de taak om een ​​datamodel voor rapportage te implementeren als een transformatie van data naar informatie. Het "Information Marts"-schema moet het bedrijf in de eerste plaats voorzien van informatie die geschikt is voor besluitvorming.

Vrij omslachtige definities weerspiegelen twee simpele feiten:

  1. Showcases van het type "Raw Data Marts" zijn gebouwd op een onbewerkte (RAW) DATA VAULT, een repository die alleen de basisconcepten bevat: HUBS, LINKS, SATELLITES;
  2. Showcases "Information Marts" zijn gebouwd met behulp van elementen van BUSINESS VAULT: PIT, BRIDGE.

Als we kijken naar voorbeelden van het opslaan van informatie over een werknemer, kunnen we zeggen dat een winkelpui die het huidige (huidige) telefoonnummer van een werknemer weergeeft, een winkel is van het type "Raw Data Marts". Om zo'n showcase te vormen, worden de bedrijfssleutel van de werknemer en de MAX()-functie gebruikt op het satellietlaaddatumattribuut (MAX(SatLoadDate)). Wanneer het nodig is om de geschiedenis van attribuutwijzigingen in de showcase op te slaan - het wordt gebruikt, moet u begrijpen vanaf welke datum de telefoon up-to-date was, de compilatie van de bedrijfssleutel en de uploaddatum naar de satelliet zal de primaire sleutel toevoegen aan zo'n tabel, het veld van de einddatum van de geldigheidsperiode wordt ook toegevoegd.

Het creëren van een etalage die up-to-date informatie opslaat voor elk attribuut van verschillende satellieten in de hub, bijvoorbeeld telefoonnummer, adres, volledige naam, impliceert het gebruik van een PIT-tabel, waardoor het gemakkelijk is om toegang te krijgen tot alle datums van relevantie. Showcases van dit type worden "Information Marts" genoemd.

Beide benaderingen zijn relevant voor zowel metingen als feiten.

Om storefronts te creëren die informatie over verschillende links en hubs opslaan, kan toegang tot BRIDGE-tabellen worden betrokken.

Met dit artikel voltooi ik de serie over het concept van DATA VAULT, ik hoop dat de informatie die ik heb gedeeld nuttig zal zijn bij de uitvoering van uw projecten.

Zoals altijd, tot slot, een paar nuttige links:

  • artikel Kenta Graziano, dat naast een gedetailleerde beschrijving ook modeldiagrammen bevat;

Bron: www.habr.com

Voeg een reactie