Data marts DATA VAULT

V predošlom články, videli sme základy DATA VAULT, rozšírenie DATA VAULT do lepšie analyzovateľného stavu a vytvorenie BUSINESS DATA VAULT. Je čas ukončiť sériu tretím článkom.

Ako som avizoval v predchádzajúcom Uverejnenie, tento článok sa bude venovať téme BI, respektíve príprave DATA VAULT ako zdroja dát pre BI. Pozrime sa na to, ako vytvoriť tabuľky faktov a dimenzií a vytvoriť tak hviezdicovú schému.

Keď som začal študovať anglickojazyčné materiály na tému vytvárania datamartov cez DATA VAULT, mal som pocit, že tento proces je dosť komplikovaný. Keďže články sú značne dlhé, existujú odkazy na zmeny v znení, ktoré sa objavili v metodike Data Vault 2.0, je naznačená dôležitosť týchto znení.

Po ponorení sa do prekladu sa však ukázalo, že tento proces nie je taký zložitý. Ale môžete mať iný názor.

A tak poďme k veci.

Tabuľky rozmerov a faktov v DATA VAULT

Najťažšie pochopiteľné informácie:

  • Tabuľky meraní sú postavené na informáciách z uzlov a ich satelitov;
  • Tabuľky faktov sú postavené na informáciách z odkazov a ich satelitov.

A to je zrejmé po prečítaní článku o Základy DATA VAULT. Huby uchovávajú jedinečné kľúče obchodných objektov, ich časovo ohraničené satelity stavu atribútov obchodných objektov, satelity viazané na odkazy podporujúce transakcie uchovávajú číselné charakteristiky týchto transakcií.

Tu teória v podstate končí.

Podľa môjho názoru je však potrebné poznamenať niekoľko konceptov, ktoré možno nájsť v článkoch o metodike DATA VAULT:

  • Raw Data Marts – vitríny „surových“ dát;
  • Information Marts - informačné vitríny.

Koncept „Raw Data Marts“ – označuje obchody postavené na údajoch DATA VAULT vykonávaním pomerne jednoduchých JOINov. Prístup „Raw Data Marts“ vám umožňuje flexibilne a rýchlo rozšíriť projekt skladu o informácie vhodné na analýzu. Tento prístup nezahŕňa vykonávanie zložitých transformácií údajov a vykonávanie obchodných pravidiel pred umiestnením do obchodu, avšak údaje Raw Data Marts by mali byť zrozumiteľné pre podnikového používateľa a mali by slúžiť ako základ pre ďalšiu transformáciu, napríklad pomocou nástrojov BI. .

Koncept „Information Marts“ sa objavil v metodológii Data Vault 2.0, nahradil starý koncept „Data Marts“. Táto zmena je spôsobená realizáciou úlohy implementácie dátového modelu pre reporting ako transformácie dát na informácie. Schéma „Information Marts“ by mala v prvom rade poskytnúť podniku informácie vhodné na rozhodovanie.

Pomerne rozvláčne definície odrážajú dva jednoduché fakty:

  1. Vitríny typu „Raw Data Marts“ sú postavené na surovom (RAW) DATA VAULT, úložisku obsahujúcom len základné pojmy: HUBS, LINKS, SATELITES;
  2. Vitríny „Information Marts“ sú postavené s použitím prvkov BUSINESS VAULT: PIT, BRIDGE.

Ak sa obrátime na príklady ukladania informácií o zamestnancovi, môžeme povedať, že výkladná skriňa, ktorá zobrazuje aktuálne (aktuálne) telefónne číslo zamestnanca, je výkladnou skriňou typu „Raw Data Marts“. Na vytvorenie takejto prezentácie sa používa obchodný kľúč zamestnanca a funkcia MAX() použitá v atribúte dátumu načítania satelitu (MAX(SatLoadDate)). Keď je potrebné ukladať históriu zmien atribútov do vitríny - používa sa, musíte pochopiť, od akého dátumu do akého dátumu bol telefón aktuálny, zostavenie obchodného kľúča a dátum načítania do satelit do takejto tabuľky pridá primárny kľúč, doplní sa aj pole dátumu ukončenia doby platnosti.

Vytvorenie výkladu, ktorý uchováva aktuálne informácie pre každý atribút niekoľkých satelitov zahrnutých v hube, napríklad telefónne číslo, adresa, celé meno, znamená použitie tabuľky PIT, prostredníctvom ktorej je jednoduchý prístup ku všetkým dátumom. relevantné. Vitríny tohto typu sa označujú ako „Information Marts“.

Oba prístupy sú relevantné pre merania aj fakty.

Na vytvorenie výkladov, ktoré uchovávajú informácie o niekoľkých prepojeniach a huboch, možno použiť prístup k tabuľkám BRIDGE.

Týmto článkom uzatváram cyklus o koncepte DATA VAULT, dúfam, že informácie, ktoré som zdieľal, budú užitočné pri realizácii vašich projektov.

Ako vždy, na záver niekoľko užitočných odkazov:

  • článok Kenta Graziano, ktorá okrem podrobného popisu obsahuje modelové diagramy;

Zdroj: hab.com

Pridať komentár