DATA VAULT izstrāde un pāreja uz BIZNESA DATU VAULT

IepriekŔējā rakstā es runāju par DATA VAULT pamatiem, aprakstÄ«ju galvenos DATA VAULT elementus un to mērÄ·i. To nevar uzskatÄ«t par DATA VAULT tēmu kā izsmeltu, ir jārunā par nākamajiem soļiem DATA VAULT evolÅ«cijā.

Un Å”ajā rakstā es pievērsÄ«Å”os DATA VAULT attÄ«stÄ«bai un pārejai uz BUSINESS DATA VAULT jeb vienkārÅ”i BUSINESS VAULT.

BIZNESA DATU VAULT parādīŔanās iemesli

JāatzÄ«mē, ka DATA VAULT, lai arÄ« tai ir noteiktas stiprās puses, nav bez trÅ«kumiem. Viens no Å”iem trÅ«kumiem ir grÅ«tÄ«bas rakstÄ«t analÄ«tiskos vaicājumus. Vaicājumiem ir ievērojams skaits JOIN, kods ir garÅ” un apgrÅ«tinoÅ”s. Tāpat DATA VAULT ievadÄ«tie dati netiek pakļauti transformācijām, tāpēc no biznesa viedokļa DATA VAULT tÄ«rā veidā nav absolÅ«tas vērtÄ«bas.

TieÅ”i Å”o trÅ«kumu novērÅ”anai DATA VAULT metodika tika paplaÅ”ināta ar tādiem elementiem kā:

  • IIN (laika laika) tabulas;
  • BRIDGE galdi;
  • IEPRIEKÅ  DEFINĒTI ATvasinājumi.

SÄ«kāk apskatÄ«sim Å”o elementu mērÄ·i.

IIN tabulas

Parasti viena biznesa vienÄ«ba (HUB) var saturēt datus ar atŔķirÄ«gu atjaunināŔanas ātrumu, piemēram, ja mēs runājam par personu raksturojoÅ”iem datiem, varam teikt, ka informācijai par tālruņa numuru, adresi vai e-pastu ir lielāks atjaunināŔanas ātrums nekā, piemēram, pilns vārds, pases dati, Ä£imenes stāvoklis vai dzimums.

Tāpēc, nosakot satelÄ«tus, jāpatur prātā to atjaunināŔanas biežums. Kāpēc tas ir svarÄ«gi?

Ja vienā tabulā glabājat atribūtus ar dažādiem atjaunināŔanas ātrumiem, tabulai būs jāpievieno rinda ikreiz, kad tiek atjaunināts visbiežāk mainītais atribūts. Rezultātā palielinās diska vieta un palielinās vaicājuma izpildes laiks.

Tagad, kad esam sadalÄ«juÅ”i satelÄ«tus pēc atjaunināŔanas biežuma un varam tajos ielādēt datus neatkarÄ«gi, mums ir jānodroÅ”ina, ka varam saņemt jaunākos datus. Labāk, neizmantojot nevajadzÄ«gus JOIN.

Ä»aujiet man paskaidrot, piemēram, jums ir jāiegÅ«st paÅ”reizējā (atbilstoÅ”i pēdējās atjaunināŔanas datumam) informācija no satelÄ«tiem, kuriem ir atŔķirÄ«gs atjaunināŔanas ātrums. Lai to izdarÄ«tu, jums bÅ«s ne tikai jāveic JOIN, bet arÄ« jāizveido vairāki ligzdoti vaicājumi (katram satelÄ«tam, kas satur informāciju), izvēloties maksimālo atjaunināŔanas datumu MAX (AtjaunināŔanas datums). Ar katru jaunu JOIN Ŕāds kods aug un ļoti ātri kļūst grÅ«ti saprotams.

IIN tabula ir izstrādāta, lai vienkārŔotu Ŕādus vaicājumus; IIN tabulas tiek aizpildītas vienlaikus ar jaunu datu ierakstīŔanu DATA VAULT. PIT tabula:

DATA VAULT izstrāde un pāreja uz BIZNESA DATU VAULT

Tādējādi mums ir informācija par datu atbilstÄ«bu visiem satelÄ«tiem katrā laika posmā. Izmantojot JOIN tabulu PIT, mēs varam pilnÄ«bā novērst ligzdotos vaicājumus, protams, ar nosacÄ«jumu, ka PIT tiek aizpildÄ«ts katru dienu un bez atstarpēm. Pat ja IIN ir nepilnÄ«bas, jÅ«s varat iegÅ«t jaunākos datus, tikai izmantojot vienu ligzdotu vaicājumu paÅ”am IIN. Viens ligzdots vaicājums tiks apstrādāts ātrāk nekā ligzdotie vaicājumi katram satelÄ«tam.

BRIDGE

BRIDGE tabulas tiek izmantotas arÄ«, lai vienkārÅ”otu analÄ«tiskos vaicājumus. Tomēr tas, kas atŔķiras no PIT, ir lÄ«dzeklis, kas vienkārÅ”o un paātrina pieprasÄ«jumus starp dažādiem centrmezgliem, saitēm un to satelÄ«tiem.

Tabulā ir visas nepiecieÅ”amās atslēgas visiem satelÄ«tiem, kuras bieži izmanto vaicājumos. Turklāt, ja nepiecieÅ”ams, jauktās biznesa atslēgas var papildināt ar atslēgām teksta formā, ja atslēgu nosaukumi ir nepiecieÅ”ami analÄ«zei.

Fakts ir tāds, ka, neizmantojot BRIDGE, saņemot datus, kas atrodas satelÄ«tos, kas pieder dažādiem centrmezgliem, bÅ«s jāveic JOIN ne tikai paÅ”iem satelÄ«tiem, bet arÄ« saitēm, kas savieno centrmezglus.

BRIDGE esamÄ«bu vai neesamÄ«bu nosaka krātuves konfigurācija un nepiecieÅ”amÄ«ba optimizēt vaicājuma izpildes ātrumu. Ir grÅ«ti izdomāt universālu BRIGE piemēru.

IEPRIEKŠ DEFINĒTI ATvasinājumi

Cits objektu veids, kas mÅ«s tuvina BIZNESA DATU VELTIVE, ir tabulas ar iepriekÅ” aprēķinātiem rādÄ«tājiem. Šādas tabulas ir ļoti svarÄ«gas uzņēmējdarbÄ«bai, tās satur informāciju, kas apkopota atbilstoÅ”i dotajiem noteikumiem un padara to salÄ«dzinoÅ”i viegli pieejamu.

ArhitektÅ«ras ziņā IEPRIEKÅ  DEFINĒTI ATvasinājumi nav nekas vairāk kā kārtējais noteikta centrmezgla satelÄ«ts. Tas, tāpat kā parasts satelÄ«ts, satur biznesa atslēgu un ieraksta izveides datumu satelÄ«tā. Tomēr Å”eit lÄ«dzÄ«bas beidzas. Tālāko Ŕāda ā€œspecializētāā€ satelÄ«ta atribÅ«tu sastāvu nosaka biznesa lietotāji, pamatojoties uz populārākajiem, iepriekÅ” aprēķinātajiem rādÄ«tājiem.

Piemēram, centrmezglā, kurā ir informācija par darbinieku, var būt satelīts ar tādiem indikatoriem kā:

  • Minimālā alga;
  • Maksimālā alga;
  • Vidējo atalgojumu;
  • Uzkrāto algu kumulatÄ«vā summa utt.

LoÄ£iski ir iekļaut IEPRIEKÅ  DEFINĒTOS ATvasinājumus tā paÅ”a centrmezgla PIT tabulā, tad var ērti iegÅ«t datu Ŕķēles darbiniekam konkrēti izvēlētā datumā.

Secinājumi

Kā liecina prakse, biznesa lietotājiem DATA VAULT lietoÅ”ana ir diezgan sarežģīta vairāku iemeslu dēļ:

  • Vaicājuma kods ir sarežģīts un apgrÅ«tinoÅ”s;
  • JOIN pārpilnÄ«ba ietekmē vaicājumu veiktspēju;
  • AnalÄ«tisku vaicājumu rakstÄ«Å”anai ir nepiecieÅ”amas izcilas zināŔanas par krātuves dizainu.

Lai vienkārŔotu piekļuvi datiem, DATA VAULT ir paplaŔināts ar papildu objektiem:

  • IIN (laika laika) tabulas;
  • BRIDGE galdi;
  • IEPRIEKÅ  DEFINĒTI ATvasinājumi.

Nākamais raksts Es plānoju pastāstīt, manuprāt, interesantāko tiem, kas strādā ar BI. Es iepazīstināŔu ar veidiem, kā izveidot faktu tabulas un dimensiju tabulas, pamatojoties uz DATA VAULT.

Raksta materiāli ir balstīti uz:

  • uz PublicÄ“Å”ana Kenta Graziano, kas papildus detalizētam aprakstam satur modeļu diagrammas;
  • Grāmata: ā€œMērogojamas datu noliktavas veidoÅ”ana ar DATA VAULT 2.0ā€;
  • Pants Datu glabātuves pamati.

Avots: www.habr.com

Pievieno komentāru