Zhvillimi i DATA VAULT dhe kalimi në BUSINESS DATA VAULT

Në artikullin e mëparshëm, unë fola për bazat e DATA VAULT, përshkrova elementët kryesorë të DATA VAULT dhe qëllimin e tyre. Kjo nuk mund të konsiderohet tema e DATA VAULT si e shteruar; është e nevojshme të flasim për hapat e ardhshëm në evoluimin e DATA VAULT.

Dhe në këtë artikull do të fokusohem në zhvillimin e DATA VAULT dhe kalimin në BUSINESS DATA VAULT ose thjesht BUSINESS VAULT.

Arsyet e shfaqjes së BUSINESS DATA VAULT

Duhet të theksohet se DATA VAULT, megjithëse ka disa pika të forta, nuk është pa të meta. Një nga këto disavantazhe është vështirësia në shkrimin e pyetjeve analitike. Pyetjet kanë një numër të konsiderueshëm JOIN-sh, kodi është i gjatë dhe i rëndë. Gjithashtu, të dhënat që hyjnë në DATA VAULT nuk pësojnë asnjë transformim, prandaj, nga pikëpamja e biznesit, DATA VAULT në formën e tij të pastër nuk ka vlerë absolute.

Ishte për të eliminuar këto mangësi që metodologjia DATA VAULT u zgjerua me elementë të tillë si:

  • tabela PIT (pika në kohë);
  • tavolina BRIDGE;
  • DERIVACIONET E PARAPAKTUARA.

Le të hedhim një vështrim më të afërt në qëllimin e këtyre elementeve.

Tavolina PIT

Në mënyrë tipike, një ent biznesi (HUB) mund të përmbajë të dhëna me ritme të ndryshme përditësimi, për shembull, nëse po flasim për të dhëna që karakterizojnë një person, mund të themi se informacioni për një numër telefoni, adresë ose email ka një shkallë më të lartë përditësimi sesa të themi, emri i plotë, të dhënat e pasaportës, statusi martesor ose gjinia.

Prandaj, kur përcaktoni satelitët, duhet të keni parasysh frekuencën e përditësimit të tyre. Pse është e rëndësishme?

Nëse ruani atribute me shpejtësi të ndryshme përditësimi në të njëjtën tabelë, do t'ju duhet të shtoni një rresht në tabelë sa herë që përditësohet atributi i ndryshuar më shpesh. Rezultati është një rritje në hapësirën në disk dhe një rritje në kohën e ekzekutimit të pyetjeve.

Tani që i kemi ndarë satelitët sipas frekuencës së përditësimit dhe mund të ngarkojmë të dhëna në to në mënyrë të pavarur, duhet të sigurohemi që mund të marrim të dhëna të përditësuara. Më mirë, pa përdorur JOIN të panevojshëm.

Më lejoni të shpjegoj, për shembull, ju duhet të merrni informacion aktual (sipas datës së përditësimit të fundit) nga satelitët që kanë shpejtësi të ndryshme përditësimi. Për ta bërë këtë, do t'ju duhet jo vetëm të bëni një JOIN, por edhe të krijoni disa pyetje të ndërlidhura (për çdo satelit që përmban informacion) me zgjedhjen e datës maksimale të përditësimit MAX (Data e Përditësimit). Me çdo JOIN të ri, një kod i tillë rritet dhe shumë shpejt bëhet i vështirë për t'u kuptuar.

Tabela PIT është krijuar për të thjeshtuar pyetje të tilla; tabelat PIT plotësohen njëkohësisht me shkrimin e të dhënave të reja në DATA VAULT. Tabela PIT:

Zhvillimi i DATA VAULT dhe kalimi në BUSINESS DATA VAULT

Kështu, ne kemi informacion në lidhje me rëndësinë e të dhënave për të gjithë satelitët në çdo moment në kohë. Duke përdorur JOIN në tabelën PIT, ne mund të eliminojmë plotësisht pyetjet e mbivendosura, natyrisht me kushtin që PIT të plotësohet çdo ditë dhe pa boshllëqe. Edhe nëse ka boshllëqe në PIT, mund të merrni të dhënat më të fundit vetëm duke përdorur një pyetje të ndërthurur në vetë PIT. Një pyetje e ndërthurur do të përpunojë më shpejt se pyetjet e mbivendosura për çdo satelit.

URË

Tabelat BRIDGE përdoren gjithashtu për të thjeshtuar pyetjet analitike. Megjithatë, ajo që ndryshon nga PIT është një mjet për të thjeshtuar dhe përshpejtuar kërkesat midis shpërndarësve të ndryshëm, lidhjeve dhe satelitëve të tyre.

Tabela përmban të gjithë çelësat e nevojshëm për të gjithë satelitët, të cilët shpesh përdoren në pyetje. Për më tepër, nëse është e nevojshme, çelësat e biznesit të hashuar mund të plotësohen me çelësa në formë teksti nëse emrat e çelësave nevojiten për analizë.

Fakti është se pa përdorur BRIDGE, në procesin e marrjes së të dhënave të vendosura në satelitë që i përkasin shpërndarësve të ndryshëm, do të jetë e nevojshme të bëhet një JOIN jo vetëm e vetë satelitëve, por edhe e lidhjeve që lidhin shpërndarësit.

Prania ose mungesa e BRIDGE përcaktohet nga konfigurimi i ruajtjes dhe nevoja për të optimizuar shpejtësinë e ekzekutimit të pyetjes. Është e vështirë të dalësh me një shembull universal të BRIGE.

DERIVACIONET E PARAPAKTUARA

Një lloj tjetër objekti që na afron me BUSINESS DATA VAULT janë tabelat që përmbajnë tregues të parallogaritur. Tabela të tilla janë vërtet të rëndësishme për biznesin; ato përmbajnë informacione të grumbulluara sipas rregullave të dhëna dhe e bëjnë relativisht të lehtë aksesin.

Arkitekturisht, DERIVACIONET E PARAPAKTUARA nuk janë gjë tjetër veçse një satelit tjetër i një qendre të caktuar. Ai, si një satelit i rregullt, përmban një çelës biznesi dhe datën e krijimit të rekordit në satelit. Megjithatë, këtu përfundojnë ngjashmëritë. Përbërja e mëtejshme e atributeve të një sateliti të tillë "të specializuar" përcaktohet nga përdoruesit e biznesit bazuar në treguesit më të njohur, të parallogaritur.

Për shembull, një qendër që përmban informacione për një punonjës mund të përfshijë një satelit me tregues të tillë si:

  • Paga minimale;
  • Paga maksimale;
  • Paga mesatare;
  • Totali kumulativ i pagave të përllogaritura, etj.

Është logjike që të përfshihen DERIVACIONET E PARAPRAKUARA në tabelën PIT të të njëjtit shpërndarës, atëherë mund të merrni me lehtësi feta të dhënash për një punonjës në një datë të zgjedhur posaçërisht.

KONKLUZIONE

Siç tregon praktika, përdorimi i DATA VAULT nga përdoruesit e biznesit është disi i vështirë për disa arsye:

  • Kodi i pyetjes është kompleks dhe i rëndë;
  • Bollëku i JOIN-ve ndikon në performancën e pyetjeve;
  • Shkrimi i pyetjeve analitike kërkon njohuri të jashtëzakonshme të dizajnit të ruajtjes.

Për të thjeshtuar aksesin e të dhënave, DATA VAULT zgjerohet me objekte shtesë:

  • tabela PIT (pika në kohë);
  • tavolina BRIDGE;
  • DERIVACIONET E PARAPAKTUARA.

Tjetra artikull Kam në plan të tregoj, për mendimin tim, gjënë më interesante për ata që punojnë me BI. Unë do të paraqes mënyra për të krijuar tabela faktesh dhe tabela dimensionesh bazuar në DATA VAULT.

Materialet e artikullit bazohen në:

  • Mbi Publikim Kenta Graziano, e cila, përveç një përshkrimi të detajuar, përmban diagrame modele;
  • Libri: “Ndërtimi i një magazine të shkallëzuar të të dhënave me DATA VAULT 2.0”;
  • artikull Bazat e kasafortës së të dhënave.

Burimi: www.habr.com

Shto një koment