Вітрыны дадзеных DATA VAULT

У папярэдніх артыкулах, мы пазнаёміліся з асновамі DATA VAULT, пашырэннем DATA VAULT да больш прыдатнага для аналізу стану і стварэннем BUSINESS DATA VAULT. Настаў час завяршаць серыю трэцім артыкулам.

Як я анансаваў у папярэдняй публікацыі, гэты артыкул будзе прысвечана тэме BI, а дакладней падрыхтоўцы DATA VAULT у якасці крыніцы дадзеных для BI. Разгледзім, як стварыць табліцы фактаў і вымярэнняў і, тым самым, стварыць схему зорка.

Калі я пачаў вывучаць англамоўныя матэрыялы па тэме стварэння вітрын дадзеных над DATA VAULT у мяне ўзнікла адчуванне дастатковай складанасці працэсу. Бо артыкулы маюць вялікі аб'ём, тамака прысутнічаюць дасылкі да змен у фармулёўках, якія з'явіліся ў метадалогіі Data Vault 2.0, пазначаецца важнасць гэтых фармулёвак.

Аднак, заглыбіўшыся ў пераклад, стала зразумела, што працэс гэты не такі ўжо і складаны. Але, магчыма, у вас складзецца іншае меркаванне.

І так, давайце пераходзіць да сутнасці.

Табліцы вымярэнняў і фактаў у DATA VAULT

Самае складаная для разумення інфармацыя:

  • Табліцы вымярэнняў будуюцца на інфармацыі хабаў і іх сатэлітаў;
  • Табліцы фактаў будуюцца на інфармацыі лінкаў і іх сатэлітаў.

І гэта відавочна, пасля чытання артыкула аб асновах DATA VAULT. Хабы захоўваюць унікальныя ключы бізнес аб'ектаў, іх сатэліты стану атрыбутаў бізнес аб'ектаў прывязаныя да часу, сатэліты, прывязаныя да лінкаў якія падтрымліваюць транзакцыі, захоўваюць лікавыя характарыстыкі гэтых транзакцый.

На гэтым тэорыя, у прынцыпе заканчваецца.

Але, усё ж, на мой погляд, неабходна адзначыць пару паняццяў, якія могуць сустрэцца ў артыкулах аб метадалогіі DATA VAULT:

  • Raw Data Marts - вітрыны "волкіх" дадзеных;
  • Information Marts - інфармацыйныя вітрыны.

Паняцце "Raw Data Marts" - абазначае вітрыны пабудаваныя, над дадзенымі DATA VAULT шляхам выканання досыць простых JOIN'аў. Падыход "Raw Data Marts" дазваляе гнутка і ў кароткія тэрміны пашырыць праект сховішчы інфармацыяй, прыдатнай для аналізу. Такі падыход не мае на ўвазе выкананне складаных трансфармацый дадзеных і выканання бізнес правілаў перад памяшканне ў вітрыну, аднак, дадзеныя "Raw Data Marts" павінны быць зразумелыя бізнес карыстачу і закліканы служыць асновай для далейшага пераўтварэння, напрыклад, інструментамі BI.

Паняцце "Information Marts" з'явілася ў метадалогіі Data Vault 2.0, яно замяніла старое паняцце "Data Marts". Гэтая змена абумоўлена ўсведамленнем задачы па рэалізацыі мадэлі дадзеных для пабудовы справаздач як пераўтварэнне дадзеных у інфармацыю. Схема "Information Marts", у першую чаргу, павінна забяспечваць бізнес прыдатнай для прыняцця рашэнняў інфармацыяй.

Досыць шматслоўныя азначэнні адлюстроўваюць два простых факта:

  1. Вітрыны тыпу "Raw Data Marts" будуюцца на волкім (RAW) DATA VAULT, сховішча ўтрымоўвальным толькі базавыя паняцці: HUBS, LINKS, SATELLITES;
  2. Вітрыны "Information Marts" будуюцца з выкарыстаннем элементаў BUSINESS VAULT: PIT, BRIDGE.

Калі звярнуцца да прыкладаў захоўвання інфармацыі аб супрацоўніку можна сказаць, што вітрына адлюстроўвае бягучы (дзейны на сёння) нумар тэлефона супрацоўніка - гэта вітрына тыпу "Raw Data Marts". Для фармавання такой вітрыны выкарыстоўваецца бізнэс ключ супрацоўніка і функцыя MAX(), выкарыстаная на атрыбуце даты загрузкі ў сатэліт (MAX(SatLoadDate)). Калі патрабуецца захоўвання гісторыі змены атрыбуту ў вітрыне - выкарыстоўваецца, трэба разумець з якой па якой дату тэлефон быў актуальны, першасным ключом такой табліцы складзе кампіляцыя бізнес ключа і даты загрузкі ў сатэліт, таксама дадаецца поле даты заканчэння перыяду актуальнасці.

Стварэнне вітрыны, якая захоўвае актуальную інфармацыю кожнага атрыбуту некалькіх сатэлітаў, які ўваходзіць у хаб, напрыклад, нумар тэлефона, адрас, ПІБ, мае на ўвазе выкарыстанне PIT табліцы, праз зварот да якой лёгка атрымаць усе даты актуальнасці. Вітрыны такога тыпу адносяць да "Information Marts".

Абодва падыходы актуальныя як для вымярэнняў, так і фактаў.

Для стварэння вітрын, якія захоўваюць інфармацыю аб некалькіх лінках і хабах можа быць задзейнічана зварот да BRIDGE табліц.

Гэтым артыкулам я завяршаю цыкл аб канцэпцыі DATA VAULT, спадзяюся інфармацыя, якой я падзяліўся будзе карысная ў рэалізацыі вашых праектаў.

Як заўсёды, у завяршэнні, некалькі карысных спасылак:

  • Артыкул Кента Грацыяна, у якой апроч дэталёвага апісання змяшчаюцца схемы мадэлі;

Крыніца: habr.com

Дадаць каментар