Magazyny danych DATA VAULT

W poprzednim artykuły, widzieliśmy podstawy DATA VAULT, rozszerzając DATA VAULT do stanu umożliwiającego większą analizę i tworząc BUSINESS DATA VAULT. Czas zakończyć serię trzecim artykułem.

Tak jak zapowiadałem w poprzednim Publikacja, w tym artykule skupimy się na temacie BI, a raczej przygotowaniu DATA VAULT jako źródła danych dla BI. Przyjrzyjmy się, jak tworzyć tabele faktów i wymiarów, a tym samym tworzyć schemat gwiazdy.

Kiedy zacząłem studiować anglojęzyczne materiały na temat tworzenia data martów przez DATA VAULT, miałem wrażenie, że proces ten jest dość skomplikowany. Ponieważ artykuły są dość obszerne, znajdują się odniesienia do zmian w sformułowaniach, które pojawiły się w metodologii Data Vault 2.0, wskazuje się na wagę tych sformułowań.

Jednak po zagłębieniu się w tłumaczenie stało się jasne, że proces ten nie jest tak skomplikowany. Ale możesz mieć inne zdanie.

A więc przejdźmy do rzeczy.

Tabele wymiarów i faktów w DATA VAULT

Najtrudniejsze do zrozumienia informacje:

  • Tabele pomiarowe są tworzone na podstawie informacji z węzłów i ich satelitów;
  • Tabele faktów są zbudowane na podstawie informacji z linków i ich satelitów.

I to jest oczywiste po przeczytaniu artykułu o Podstawy DATA VAULT. Koncentratory przechowują unikalne klucze obiektów biznesowych, ich czasowe satelity stanu atrybutów obiektów biznesowych, satelity powiązane z łączami obsługującymi transakcje przechowują charakterystykę numeryczną tych transakcji.

Na tym w zasadzie kończy się teoria.

Niemniej jednak, moim zdaniem, należy zwrócić uwagę na kilka koncepcji, które można znaleźć w artykułach na temat metodologii DATA VAULT:

  • Raw Data Marts - prezentacja „surowych” danych;
  • Information Marts - gabloty informacyjne.

Koncepcja „Raw Data Marts” — oznacza hurtownie zbudowane na danych DATA VAULT poprzez wykonywanie dość prostych operacji JOIN. Podejście „Raw Data Marts” pozwala elastycznie i szybko rozbudować projekt hurtowni o informacje nadające się do analizy. Podejście to nie wiąże się z wykonywaniem skomplikowanych transformacji danych i wykonywaniem reguł biznesowych przed umieszczeniem ich w sklepie, jednak dane Raw Data Marts powinny być zrozumiałe dla użytkownika biznesowego i służyć jako podstawa do dalszej transformacji np. przez narzędzia BI .

Koncepcja „Information Marts” pojawiła się w metodologii Data Vault 2.0, zastąpiła starą koncepcję „Data Marts”. Zmiana ta wynika z realizacji zadania wdrożenia modelu danych do raportowania jako przekształcenia danych w informację. System „Information Marts” powinien przede wszystkim dostarczać biznesowi informacji przydatnych do podejmowania decyzji.

Dość rozwlekłe definicje odzwierciedlają dwa proste fakty:

  1. Witryny typu „Raw Data Marts” zbudowane są na surowym (RAW) DATA VAULT, repozytorium zawierającym tylko podstawowe pojęcia: HUBY, ŁĄCZA, SATELITY;
  2. Witryny "Information Marts" zbudowane są z elementów BUSINESS VAULT: PIT, BRIDGE.

Jeśli przejdziemy do przykładów przechowywania informacji o pracowniku, możemy powiedzieć, że witryna sklepowa wyświetlająca aktualny (aktualny) numer telefonu pracownika jest witryną typu „Raw Data Marts”. Do stworzenia takiej wizytówki wykorzystuje się klucz biznesowy pracownika oraz funkcję MAX() używaną na atrybucie daty załadunku satelity (MAX(SatLoadDate)). Kiedy wymagane jest przechowywanie historii zmian atrybutów w gablocie - jest używany, trzeba zrozumieć, od której daty telefon był aktualny, zestawienie klucza biznesowego i datę wgrania do satelity doda klucz podstawowy do takiej tabeli, dodawane jest również pole daty końcowej okresu ważności.

Stworzenie sklepu przechowującego aktualne informacje dla każdego atrybutu kilku satelitów wchodzących w skład huba, np. numer telefonu, adres, imię i nazwisko, wiąże się z wykorzystaniem tabeli PIT, dzięki której łatwo uzyskać dostęp do wszystkich dat istotne. Witryny tego typu określane są mianem „Information Marts”.

Oba podejścia są istotne zarówno dla pomiarów, jak i dla faktów.

Aby utworzyć witryny sklepowe przechowujące informacje o kilku łączach i koncentratorach, można zaangażować dostęp do tabel BRIDGE.

Tym artykułem kończę serię dotyczącą koncepcji DATA VAULT, mam nadzieję, że informacje, którymi się podzieliłem, będą przydatne przy realizacji Państwa projektów.

Jak zwykle na zakończenie kilka przydatnych linków:

  • Artykuł Kenta Graziano, która oprócz szczegółowego opisu zawiera schematy modelowe;

Źródło: www.habr.com

Dodaj komentarz