Data marts DATA VAULT

V předchozím články, viděli jsme základy DATA VAULT, rozšíření DATA VAULT do lépe analyzovatelného stavu a vytvoření BUSINESS DATA VAULT. Je čas ukončit sérii třetím článkem.

Jak jsem avizoval v předchozím Uveřejnění, se tento článek bude věnovat tématu BI, respektive přípravě DATA VAULTU jako zdroje dat pro BI. Podívejme se, jak vytvořit tabulky faktů a dimenzí a vytvořit tak hvězdicové schéma.

Když jsem začal studovat anglicky psané materiály na téma vytváření datových tržišť přes DATA VAULT, měl jsem pocit, že je to poměrně komplikovaný proces. Vzhledem k tomu, že články jsou značně dlouhé, jsou zde odkazy na změny ve znění, které se objevily v metodice Data Vault 2.0, je naznačena důležitost těchto formulací.

Po ponoření se do překladu se však ukázalo, že tento proces není tak složitý. Ale můžete mít jiný názor.

A tak pojďme k věci.

Tabulky dimenzí a faktů v DATA VAULT

Nejobtížnější informace k pochopení:

  • Tabulky měření jsou postaveny na informacích z hubů a jejich satelitů;
  • Tabulky faktů jsou postaveny na informacích z odkazů a jejich satelitů.

A to je zřejmé po přečtení článku o Základy DATA VAULT. Huby uchovávají jedinečné klíče obchodních objektů, jejich časově vázané satelity stavu atributů obchodních objektů, satelity vázané na odkazy podporující transakce ukládají číselné charakteristiky těchto transakcí.

Zde teorie v podstatě končí.

Podle mého názoru je však nutné poznamenat několik pojmů, které lze nalézt v článcích o metodice DATA VAULT:

  • Raw Data Marts – ukázky „surových“ dat;
  • Information Marts - informační vitríny.

Koncept "Raw Data Marts" - znamená ukázky postavené na datech DATA VAULT prováděním poměrně jednoduchých JOINů. Přístup „Raw Data Marts“ umožňuje flexibilně a rychle rozšířit projekt skladu o informace vhodné pro analýzu. Tento přístup nezahrnuje provádění složitých transformací dat a provádění obchodních pravidel před umístěním do obchodu, nicméně data Raw Data Marts by měla být srozumitelná pro podnikového uživatele a měla by sloužit jako základ pro další transformaci, například pomocí nástrojů BI. .

Koncept „Information Marts“ se objevil v metodologii Data Vault 2.0, nahradil starý koncept „Data Marts“. Tato změna je způsobena realizací úkolu implementace datového modelu pro reporting jako transformace dat na informace. Schéma „Information Marts“ by mělo v první řadě poskytnout podniku informace vhodné pro rozhodování.

Poněkud rozvláčné definice odrážejí dvě jednoduchá fakta:

  1. Vitríny typu „Raw Data Marts“ jsou postaveny na surovém (RAW) DATA VAULT, úložišti obsahujícím pouze základní pojmy: HUBS, LINKS, SATELITY;
  2. Vitríny "Information Marts" jsou postaveny pomocí prvků BUSINESS VAULT: PIT, BRIDGE.

Pokud se podíváme na příklady ukládání informací o zaměstnanci, můžeme říci, že výloha zobrazující aktuální (aktuální) telefonní číslo zaměstnance je výloha typu „Raw Data Marts“. K vytvoření takové ukázky se používá obchodní klíč zaměstnance a funkce MAX() použitá v atributu data načítání satelitu (MAX(SatLoadDate)). Když je potřeba ukládat historii změn atributů do vitríny - používá se, musíte pochopit, od jakého data do jakého data byl telefon aktuální, sestavení obchodního klíče a datum načtení do satelit do takové tabulky přidá primární klíč, je doplněno i pole data konce doby platnosti.

Vytvoření obchodu, který uchovává aktuální informace pro každý atribut několika satelitů zahrnutých v hubu, například telefonní číslo, adresa, celé jméno, znamená použití tabulky PIT, pomocí které je snadný přístup ke všem datům. relevantní. Vitríny tohoto typu se označují jako „Information Marts“.

Oba přístupy jsou relevantní jak pro měření, tak pro fakta.

Chcete-li vytvořit výklady, které ukládají informace o několika odkazech a centrech, lze použít přístup k tabulkám BRIDGE.

Tímto článkem uzavírám cyklus o konceptu DATA VAULT, doufám, že informace, které jsem sdílel, budou užitečné při realizaci vašich projektů.

Jako vždy na závěr několik užitečných odkazů:

  • Článek Kenta Graziano, která kromě podrobného popisu obsahuje modelová schémata;

Zdroj: www.habr.com

Přidat komentář