DATA VAULTin kehittäminen ja siirtyminen BUSINESS DATA VAULTiin

Edellisessä artikkelissa puhuin DATA VAULTin perusteista, kuvailin DATA VAULTin pääelementtejä ja niiden tarkoitusta. Tätä ei voida pitää DATA VAULTin aiheena loppuun asti, vaan on tarpeen puhua DATA VAULTin kehityksen seuraavista vaiheista.

Ja tässä artikkelissa keskityn DATA VAULTin kehittämiseen ja siirtymiseen BUSINESS DATA VAULTiin tai yksinkertaisesti BUSINESS VAULTiin.

BUSINESS DATA VAULTin ilmestymisen syyt

On huomattava, että vaikka DATA VAULTilla on tiettyjä vahvuuksia, se ei ole vailla haittoja. Yksi näistä haitoista on analyyttisten kyselyjen kirjoittamisen vaikeus. Kyselyissä on huomattava määrä JOIN-kohtia, koodi on pitkä ja hankala. Myöskään DATA VAULTiin syötetyissä tiedoissa ei tapahdu mitään muunnoksia, joten liiketoiminnan kannalta DATA VAULTilla ei puhtaassa muodossaan ole absoluuttista arvoa.

Näiden puutteiden poistamiseksi DATA VAULT -metodologiaa laajennettiin seuraavilla elementeillä:

  • PIT-taulukot;
  • BRIDGE taulukot;
  • ENNAKKOMÄÄRITELMÄT JOHDANNAISET.

Tarkastellaanpa tarkemmin näiden elementtien tarkoitusta.

PIT-taulukot

Tyypillisesti yksi yrityskokonaisuus (HUB) voi sisältää tietoja, joilla on eri päivitystiheys, esimerkiksi jos puhutaan henkilöä kuvaavasta tiedosta, voidaan sanoa, että puhelinnumeron, osoitteen tai sähköpostin tiedoilla on suurempi päivitysnopeus kuin esim. koko nimi, passitiedot, siviilisääty tai sukupuoli.

Siksi satelliitteja määritettäessä tulee pitää mielessä niiden päivitystiheys. Miksi se on tärkeää?

Jos tallennat samaan taulukkoon attribuutteja, joilla on eri päivitysnopeus, sinun on lisättävä taulukkoon rivi aina, kun useimmin muuttunut määrite päivitetään. Seurauksena on levytilan kasvu ja kyselyn suoritusajan piteneminen.

Nyt kun olemme jakaneet satelliitit päivitystiheyden mukaan ja voimme ladata niihin tietoja itsenäisesti, meidän on varmistettava, että voimme vastaanottaa ajantasaista dataa. Parempi, ilman tarpeettomia JOINeja.

Selitän esimerkiksi, että sinun on hankittava nykyiset (viimeisimmän päivityksen päivämäärän mukaan) tiedot satelliiteista, joilla on eri päivitysnopeus. Tätä varten sinun ei tarvitse tehdä vain JOIN, vaan myös luoda useita sisäkkäisiä kyselyitä (jokaiselle satelliitille, joka sisältää tietoja) valitsemalla enimmäispäivityspäivämäärä MAX (päivityspäivämäärä). Jokaisen uuden JOINin myötä tällainen koodi kasvaa ja siitä tulee nopeasti vaikea ymmärtää.

PIT-taulukko on suunniteltu yksinkertaistamaan tällaisia ​​kyselyitä; PIT-taulukot täytetään samanaikaisesti uusien tietojen kirjoittamisen kanssa DATA VAULTiin. PIT-taulukko:

DATA VAULTin kehittäminen ja siirtyminen BUSINESS DATA VAULTiin

Näin ollen meillä on tietoa datan merkityksestä kaikille satelliiteille kullakin hetkellä. Käyttämällä JOIN-koodeja PIT-taulukkoon voimme eliminoida sisäkkäiset kyselyt kokonaan, luonnollisesti sillä ehdolla, että PIT täytetään joka päivä ja ilman aukkoja. Vaikka PIT:ssä olisi aukkoja, voit saada uusimmat tiedot vain yhdellä sisäkkäisellä kyselyllä itse PIT:ään. Yksi sisäkkäinen kysely käsittelee nopeammin kuin sisäkkäiset kyselyt jokaiselle satelliitille.

SILTA

BRIDGE-taulukoita käytetään myös analyyttisten kyselyiden yksinkertaistamiseen. PIT:stä eroaa kuitenkin keino yksinkertaistaa ja nopeuttaa pyyntöjä eri keskittimien, linkkien ja niiden satelliittien välillä.

Taulukko sisältää kaikki tarvittavat avaimet kaikille satelliiteille, joita usein käytetään kyselyissä. Lisäksi hajautettuja yritysavaimia voidaan tarvittaessa täydentää tekstimuodossa olevilla avaimilla, jos avainten nimiä tarvitaan analysointiin.

Tosiasia on, että käyttämättä BRIDGEä eri keskittimiin kuuluvissa satelliiteissa sijaitsevien tietojen vastaanottamisen yhteydessä on tehtävä JOIN paitsi itse satelliiteista myös keskittimiä yhdistävistä linkeistä.

BRIDGE:n olemassaolo tai puuttuminen määräytyy tallennuskokoonpanon ja tarpeen optimoida kyselyn suoritusnopeus. On vaikea keksiä universaalia esimerkkiä BRIGEstä.

ENNAKKOMÄÄRITELMÄT JOHDANNAISET

Toinen objektityyppi, joka tuo meidät lähemmäksi BUSINESS DATA VAULTia, ovat taulukot, jotka sisältävät ennalta laskettuja indikaattoreita. Tällaiset taulukot ovat todella tärkeitä yrityksille, ne sisältävät annettujen sääntöjen mukaan koottua tietoa ja tekevät niihin pääsyn suhteellisen helposti.

Arkkitehtonisesti ENNAKKO- MÄÄRITELMÄT JOHDANNAISET eivät ole muuta kuin tietyn keskuksen toinen satelliitti. Se, kuten tavallinen satelliitti, sisältää liikeavaimen ja tietueen luomispäivämäärän satelliitissa. Tähän yhtäläisyydet kuitenkin loppuvat. Yrityskäyttäjät määrittävät tällaisen "erikoistuneen" satelliitin ominaisuuksien lisäkoostumuksen suosituimpien, ennalta laskettujen indikaattorien perusteella.

Esimerkiksi keskitin, joka sisältää tietoja työntekijästä, voi sisältää satelliitin, jossa on ilmaisimia, kuten:

  • Minimi palkka;
  • Maksimipalkka;
  • Keskipalkka;
  • Kertyneet palkat jne.

On loogista sisällyttää ENNAKKOON MÄÄRITELTYJÄ JOHDANNAISIA saman keskittimen PIT-taulukkoon, jolloin voit helposti hankkia tietoviipaleet työntekijälle erikseen valittuna päivänä.

JOHTOPÄÄTÖKSET

Kuten käytäntö osoittaa, DATA VAULTin käyttö yrityskäyttäjille on melko vaikeaa useista syistä:

  • Kyselykoodi on monimutkainen ja hankala;
  • JOIN:ien runsaus vaikuttaa kyselyiden suorituskykyyn.
  • Analyyttisten kyselyiden kirjoittaminen vaatii erinomaista tietoa varastosuunnittelusta.

Tietojen käytön yksinkertaistamiseksi DATA VAULT on laajennettu lisäobjekteilla:

  • PIT-taulukot;
  • BRIDGE taulukot;
  • ENNAKKOMÄÄRITELMÄT JOHDANNAISET.

Seuraava статье Aion kertoa mielestäni mielenkiintoisimman asian niille, jotka työskentelevät BI:n parissa. Esittelen tapoja luoda tietotaulukoita ja mittataulukoita DATA VAULTin pohjalta.

Artikkelin materiaalit perustuvat:

  • Päälle Julkaisu Kenta Graziano, joka sisältää yksityiskohtaisen kuvauksen lisäksi mallikaavioita;
  • Kirja: "Skaalautuvan tietovaraston rakentaminen DATA VAULT 2.0:lla";
  • artikkeli Data Vaultin perusteet.

Lähde: will.com

Lisää kommentti