Þróun DATA VAULT og umskipti í BUSINESS DATA VAULT

Í fyrri greininni talaði ég um grunnatriði DATA VAULT, lýsti helstu þáttum DATA VAULT og tilgangi þeirra. Þetta getur ekki talist efnið í DATA VAULT sem útrætt; það er nauðsynlegt að tala um næstu skref í þróun DATA VAULT.

Og í þessari grein mun ég einbeita mér að þróun DATA VAULT og umskiptin í BUSINESS DATA VAULT eða einfaldlega BUSINESS VAULT.

Ástæður fyrir útliti BUSINESS DATA VULT

Það skal tekið fram að DATA VAULT, þó að það hafi ákveðna styrkleika, er ekki án galla. Einn af þessum ókostum er erfiðleikinn við að skrifa greiningarfyrirspurnir. Fyrirspurnir hafa umtalsverðan fjölda JOINs, kóðinn er langur og fyrirferðarmikill. Einnig eru gögnin sem fara inn í DATA VAULT ekki undir neinum umbreytingum, því frá viðskiptalegu sjónarmiði hefur DATA VAULT í sinni hreinu mynd ekkert algjört gildi.

Það var til að útrýma þessum göllum sem DATA VAULT aðferðafræðin var stækkuð með slíkum þáttum eins og:

  • PIT (tímapunktur) töflur;
  • BRIDGE töflur;
  • FORSKILEGAR AFLEITUR.

Við skulum skoða nánar tilgang þessara þátta.

PIT töflur

Venjulega getur ein rekstrareining (HUB) innihaldið gögn með mismunandi uppfærsluhraða, til dæmis, ef við erum að tala um gögn sem einkenna manneskju, getum við sagt að upplýsingar um símanúmer, heimilisfang eða tölvupóst hafi hærra uppfærsluhlutfall en til dæmis, fullt nafn, vegabréfsupplýsingar, hjúskaparstaða eða kyn.

Þess vegna, þegar þú ákvarðar gervihnött, ættir þú að hafa í huga uppfærslutíðni þeirra. Hvers vegna er það mikilvægt?

Ef þú geymir eiginleika með mismunandi uppfærsluhraða í sömu töflu, verður þú að bæta línu við töfluna í hvert skipti sem oftast breytta eigindin er uppfærð. Niðurstaðan er aukning á plássi á diski og aukning á framkvæmdartíma fyrirspurna.

Nú þegar við höfum skipt gervitunglunum eftir uppfærslutíðni og getum hlaðið gögnum inn í þau sjálfstætt ættum við að tryggja að við getum tekið á móti uppfærðum gögnum. Betra, án þess að nota óþarfa JOINs.

Leyfðu mér að útskýra, til dæmis, þú þarft að fá núverandi (samkvæmt dagsetningu síðustu uppfærslu) upplýsingar frá gervihnöttum sem hafa mismunandi uppfærsluhraða. Til að gera þetta þarftu ekki aðeins að gera JOIN, heldur einnig að búa til nokkrar hreiðrar fyrirspurnir (fyrir hvern gervihnött sem inniheldur upplýsingar) með vali á hámarksuppfærsludagsetningu MAX (uppfærsludagsetning). Með hverjum nýjum JOIN vex slíkur kóði og verður mjög fljótt erfitt að skilja.

PIT taflan er hönnuð til að einfalda slíkar fyrirspurnir; PIT töflur eru fylltar samtímis með því að skrifa ný gögn í DATA VULT. PIT borð:

Þróun DATA VAULT og umskipti í BUSINESS DATA VAULT

Þannig höfum við upplýsingar um mikilvægi gagna fyrir öll gervitungl á hverjum tímapunkti. Með því að nota JOINs við PIT töfluna getum við alveg útrýmt hreiðri fyrirspurnum, náttúrulega með því skilyrði að PIT sé fyllt á hverjum degi og án eyður. Jafnvel þó að það séu eyður í PIT, geturðu fengið nýjustu gögnin aðeins með því að nota eina hreiðra fyrirspurn í PIT sjálft. Ein hreiðruð fyrirspurn mun vinna hraðar en hreiðruð fyrirspurnir í hvern gervihnött.

BRIDGE

BRIDGE töflur eru einnig notaðar til að einfalda greiningarfyrirspurnir. Hins vegar, það sem er frábrugðið PIT er leið til að einfalda og flýta fyrir beiðnum milli ýmissa miðstöðva, tengla og gervitungla þeirra.

Taflan inniheldur alla nauðsynlega lykla fyrir öll gervihnött, sem oft eru notuð í fyrirspurnum. Að auki, ef nauðsyn krefur, er hægt að bæta við hashedum viðskiptalykla með lyklum á textaformi ef nöfn lyklanna þarf til greiningar.

Staðreyndin er sú að án þess að nota BRIDGE, í því ferli að taka á móti gögnum sem eru staðsett í gervihnöttum sem tilheyra mismunandi miðstöðvum, verður nauðsynlegt að gera JOIN ekki aðeins gervihnöttunum sjálfum heldur einnig hlekkjunum sem tengja miðstöðina.

Tilvist eða fjarvera BRIDGE ræðst af geymslustillingunni og þörfinni á að hámarka hraða framkvæmdar fyrirspurnar. Það er erfitt að koma með algilt dæmi um BRIGE.

FORSKILEGAR AFLEITUR

Önnur tegund af hlutum sem færir okkur nær BUSINESS DATA VULT eru töflur sem innihalda fyrirfram reiknaða vísbendingar. Slíkar töflur eru mjög mikilvægar fyrir fyrirtæki, þær innihalda upplýsingar samanlagðar samkvæmt gefnum reglum og gera það tiltölulega auðvelt að nálgast þær.

Byggingarfræðilega séð eru FORSKILEGAR AFRIÐUR ekkert annað en annar gervihnöttur ákveðins miðstöðvar. Það, eins og venjulegur gervihnöttur, inniheldur viðskiptalykil og dagsetningu stofnunar skráar í gervihnöttnum. Hér endar þó líkindin. Frekari samsetning eiginleika slíks „sérhæfðs“ gervihnattar er ákvörðuð af viðskiptanotendum byggt á vinsælustu, fyrirfram útreiknuðu vísunum.

Til dæmis getur miðstöð sem inniheldur upplýsingar um starfsmann innihaldið gervihnött með vísum eins og:

  • Lágmarkslaun;
  • Hámarkslaun;
  • Meðallaun;
  • Uppsöfnuð samtala áfallinna launa o.fl.

Það er rökrétt að setja fyrirfram skilgreindar afleiður í PIT töflu sama miðstöð, þá getur þú auðveldlega nálgast gagnasneiðar fyrir starfsmann á sérstaklega valinni dagsetningu.

Ályktanir

Eins og venjan sýnir er notkun DATA VAULT af viðskiptanotendum nokkuð erfið af ýmsum ástæðum:

  • Fyrirspurnarkóði er flókinn og fyrirferðarmikill;
  • Mikið JOIN hefur áhrif á árangur fyrirspurna;
  • Að skrifa greiningarfyrirspurnir krefst framúrskarandi þekkingar á geymsluhönnun.

Til að einfalda gagnaaðgang er DATA VAULT stækkað með viðbótarhlutum:

  • PIT (tímapunktur) töflur;
  • BRIDGE töflur;
  • FORSKILEGAR AFLEITUR.

Næst grein Ég ætla að segja, að mínu mati, það áhugaverðasta fyrir þá sem starfa við BI. Ég mun kynna leiðir til að búa til staðreyndatöflur og víddartöflur byggðar á DATA VAULT.

Efni greinarinnar eru byggð á:

  • Á Birting Kenta Graziano, sem, auk ítarlegrar lýsingu, inniheldur líkanaskýringarmyndir;
  • Bók: „Að byggja upp skalanlegt gagnavöruhús með DATA VAULT 2.0“;
  • Gr Grunnatriði gagnahólfsins.

Heimild: www.habr.com

Bæta við athugasemd