Витрини за данни DATA VAULT

В предишния статии, видяхме основите на DATA VAULT, разширяване на DATA VAULT до по-разбираемо състояние и създаване на БИЗНЕС ДАННИ VAULT. Време е да приключим поредицата с третата статия.

Както обявих в предишния Публикуване, тази статия ще се фокусира върху темата за BI или по-скоро подготовката на DATA VAULT като източник на данни за BI. Нека да разгледаме как да създадем таблици с факти и измерения и по този начин да създадем звездна схема.

Когато започнах да изучавам англоезични материали по темата за създаване на витрини за данни върху DATA VAULT, имах чувството, че процесът е доста сложен. Тъй като статиите са със значителна дължина, има препратки към промени във формулировката, които се появяват в методологията Data Vault 2.0, важността на тези формулировки е посочена.

Въпреки това, след като се зарових в превода, стана ясно, че този процес не е толкова сложен. Но вие може да имате различно мнение.

И така, да преминем към същината.

Таблици с измерения и факти в DATA VAULT

Най-трудната информация за разбиране:

  • Таблиците за измерване са изградени на базата на информация от хъбове и техните сателити;
  • Таблиците с факти са изградени на базата на информация от връзки и техните сателити.

И това е очевидно, след като прочетете статията за Основи на DATA ULT. Хъбовете съхраняват уникални ключове на бизнес обекти, техните ограничени във времето сателити на състоянието на атрибутите на бизнес обекта, сателити, свързани с връзки, поддържащи транзакции, съхраняват числените характеристики на тези транзакции.

Това е мястото, където теорията основно свършва.

Но въпреки това, по мое мнение, е необходимо да се отбележат няколко концепции, които могат да бъдат намерени в статии за методологията DATA VAULT:

  • Raw Data Marts – витрини на „сурови“ данни;
  • Information Marts - информационни витрини.

Концепцията за „витрини с необработени данни“ – обозначава витрини, изградени върху данни от DATA VAULT чрез изпълнение на сравнително прости JOINs. Подходът „Raw Data Marts“ ви позволява гъвкаво и бързо да разширите проекта за склад с информация, подходяща за анализ. Този подход не включва извършване на сложни трансформации на данни и изпълнение на бизнес правила, преди да бъдат поставени във витрината, но данните от Raw Data Marts трябва да са разбираеми за бизнес потребителя и трябва да служат като основа за по-нататъшна трансформация, например чрез BI инструменти .

Концепцията за „Information Marts“ се появи в методологията Data Vault 2.0, тя замени старата концепция „Data Marts“. Тази промяна се дължи на реализацията на задачата за внедряване на модел на данни за отчитане като трансформация на данни в информация. Схемата „Информационни борси” на първо място трябва да предостави на бизнеса информация, подходяща за вземане на решения.

Доста многословните определения отразяват два прости факта:

  1. Витрините от типа “Raw Data Marts” са изградени върху необработен (RAW) DATA VAULT, хранилище, съдържащо само основните понятия: ХЪБОВЕ, ВРЪЗКИ, САТЕЛИТИ;
  2. Витрини "Информационни пазари" са изградени с елементи на БИЗНЕС ТРЕЗОР: ЯМА, МОСТ.

Ако се обърнем към примери за съхраняване на информация за служител, можем да кажем, че витрина, която показва текущия (текущ) телефонен номер на служител, е витрина от типа „Marts с необработени данни“. За формиране на такава витрина се използват бизнес ключът на служителя и функцията MAX(), използвана в атрибута за дата на сателитно зареждане (MAX(SatLoadDate)). Когато се изисква да съхранявате историята на промените на атрибутите във витрината - използва се, трябва да разберете от коя дата до коя дата телефонът е бил актуален, съставянето на бизнес ключа и датата на зареждане на сателитът ще добави първичния ключ към такава таблица, полето на крайната дата на периода на валидност също се добавя.

Създаването на витрина, която съхранява актуална информация за всеки атрибут на няколко сателита, включени в хъба, например телефонен номер, адрес, пълно име, предполага използването на PIT таблица, чрез която е лесен достъп до всички дати от значение. Витрините от този тип се наричат ​​„Информационни пазари“.

И двата подхода са подходящи както за измерванията, така и за фактите.

За да създадете витрини, които съхраняват информация за няколко връзки и хъбове, може да се използва достъп до BRIDGE таблици.

С тази статия завършвам поредицата за концепцията на DATA VAULT, надявам се информацията, която споделих, ще бъде полезна при изпълнението на вашите проекти.

Както винаги, в заключение няколко полезни връзки:

  • статия Kenta Graziano, който освен подробно описание, съдържа диаграми на модели;

Източник: www.habr.com

Добавяне на нов коментар