Data marts DATA VAULT

Sa nakaraan mga artikulo, nakita namin ang mga pangunahing kaalaman sa DATA VAULT, pagpapalawak ng DATA VAULT sa isang mas maihahambing na estado, at paggawa ng BUSINESS DATA VAULT. Oras na para tapusin ang serye sa ikatlong artikulo.

Gaya ng inihayag ko sa nakaraan Publikasyon, tututok ang artikulong ito sa paksa ng BI, o sa halip ang paghahanda ng DATA VAULT bilang data source para sa BI. Tingnan natin kung paano lumikha ng mga talahanayan ng katotohanan at dimensyon at sa gayon ay lumikha ng isang star schema.

Noong nagsimula akong mag-aral ng mga materyales sa wikang Ingles sa paksa ng paglikha ng mga data mart sa DATA VAULT, naramdaman kong medyo kumplikado ang proseso. Dahil ang mga artikulo ay may malaking haba, may mga sanggunian sa mga pagbabago sa mga salita na lumitaw sa pamamaraan ng Data Vault 2.0, ang kahalagahan ng mga salitang ito ay ipinahiwatig.

Gayunpaman, nang masuri ang pagsasalin, naging malinaw na ang prosesong ito ay hindi masyadong kumplikado. Ngunit maaari kang magkaroon ng ibang opinyon.

At kaya, pumunta tayo sa punto.

Mga talahanayan ng sukat at katotohanan sa DATA VAULT

Ang pinakamahirap na impormasyon na maunawaan:

  • Ang mga talahanayan ng pagsukat ay binuo sa impormasyon mula sa mga hub at kanilang mga satellite;
  • Ang mga talahanayan ng katotohanan ay binuo sa impormasyon mula sa mga link at kanilang mga satellite.

At ito ay malinaw pagkatapos basahin ang artikulo tungkol sa Mga pangunahing kaalaman sa DATA VAULT. Ang mga hub ay nag-iimbak ng mga natatanging susi ng mga bagay sa negosyo, ang kanilang mga time-bound na satellite ng estado ng mga katangian ng bagay sa negosyo, ang mga satellite na nakatali sa mga link na sumusuporta sa mga transaksyon ay nag-iimbak ng mga numerical na katangian ng mga transaksyong ito.

Dito talaga nagtatapos ang teorya.

Ngunit, gayunpaman, sa palagay ko, kinakailangang tandaan ang ilang mga konsepto na matatagpuan sa mga artikulo tungkol sa pamamaraan ng DATA VAULT:

  • Raw Data Mart - mga showcase ng "raw" na data;
  • Information Mart - mga showcase ng impormasyon.

Ang konsepto ng "Raw Data Mart" - nagsasaad ng mga mart na binuo sa DATA VAULT data sa pamamagitan ng pagsasagawa ng medyo simpleng JOIN. Ang diskarte na "Raw Data Mart" ay nagbibigay-daan sa iyo na flexible at mabilis na palawakin ang proyekto ng warehouse na may impormasyong angkop para sa pagsusuri. Ang diskarte na ito ay hindi nagsasangkot ng pagsasagawa ng mga kumplikadong pagbabago ng data at pagpapatupad ng mga panuntunan sa negosyo bago ilagay sa storefront, gayunpaman, ang data ng Raw Data Mart ay dapat na maunawaan ng user ng negosyo at dapat magsilbing batayan para sa karagdagang pagbabago, halimbawa, sa pamamagitan ng mga tool ng BI .

Ang konsepto ng "Information Marts" ay lumitaw sa Data Vault 2.0 methodology, pinalitan nito ang lumang konsepto ng "Data Marts". Ang pagbabagong ito ay dahil sa pagsasakatuparan ng gawain ng pagpapatupad ng modelo ng data para sa pag-uulat bilang pagbabago ng data sa impormasyon. Ang scheme ng "Information Marts", una sa lahat, ay dapat magbigay sa negosyo ng impormasyong angkop para sa paggawa ng desisyon.

Sa halip, ang mga kahulugan ng salita ay nagpapakita ng dalawang simpleng katotohanan:

  1. Ang mga showcase ng uri ng "Raw Data Mart" ay binuo sa isang raw (RAW) DATA VAULT, isang repository na naglalaman lamang ng mga pangunahing konsepto: HUBS, LINKS, SATELLITES;
  2. Ang mga showcase na "Information Marts" ay binuo gamit ang mga elemento ng BUSINESS VAULT: PIT, BRIDGE.

Kung bumaling tayo sa mga halimbawa ng pag-iimbak ng impormasyon tungkol sa isang empleyado, masasabi nating ang isang storefront na nagpapakita ng kasalukuyang (kasalukuyang) numero ng telepono ng isang empleyado ay isang storefront ng uri ng "Raw Data Mart." Upang bumuo ng naturang showcase, ginagamit ang business key ng empleyado at ang MAX() function na ginamit sa satellite loading date attribute (MAX(SatLoadDate)). Kapag kinakailangan na mag-imbak ng kasaysayan ng mga pagbabago sa katangian sa showcase - ito ay ginagamit, kailangan mong maunawaan kung saang petsa ang telepono ay napapanahon, ang compilation ng business key at ang petsa ng pag-upload sa satellite ay idaragdag ang pangunahing susi sa naturang talahanayan, ang patlang ng petsa ng pagtatapos ng panahon ng bisa ay idaragdag din.

Ang paggawa ng storefront na nag-iimbak ng up-to-date na impormasyon para sa bawat katangian ng ilang satellite na kasama sa hub, halimbawa, numero ng telepono, address, buong pangalan, ay nagpapahiwatig ng paggamit ng PIT table, kung saan madaling ma-access ang lahat ng petsa ng kaugnayan. Ang mga showcase ng ganitong uri ay tinutukoy bilang "Information Mart".

Ang parehong mga diskarte ay may kaugnayan para sa parehong mga sukat at katotohanan.

Upang lumikha ng mga storefront na nag-iimbak ng impormasyon tungkol sa ilang mga link at hub, maaaring gamitin ang access sa mga talahanayan ng BRIDGE.

Sa artikulong ito, kinukumpleto ko ang serye sa konsepto ng DATA VAULT, sana ay maging kapaki-pakinabang ang impormasyong ibinahagi ko sa pagpapatupad ng iyong mga proyekto.

Gaya ng nakasanayan, bilang konklusyon, ilang kapaki-pakinabang na link:

  • Artikulo Kenta Graziano, na, bilang karagdagan sa isang detalyadong paglalarawan, ay naglalaman ng mga diagram ng modelo;

Pinagmulan: www.habr.com

Magdagdag ng komento