DATA VAULT-en garapena eta BUSINESS DATA VAULT-ra igarotzea

Aurreko artikuluan, DATA VAULT-en oinarriei buruz hitz egin nuen, DATA VAULT-en elementu nagusiak eta haien helburua deskribatu nituen. Hau ezin da DATA VAULT-en gaia agortutzat jo; beharrezkoa da DATA VAULT-en bilakaeraren hurrengo urratsez hitz egitea.

Eta artikulu honetan DATA VAULT-en garapenean eta BUSINESS DATA VAULT-ra edo, besterik gabe, BUSINESS VAULT-ra igarotzean zentratuko naiz.

NEGOZIO DATU GOBEGIA agertzeko arrazoiak

Kontuan izan behar da DATA VAULT, zenbait indargune izan arren, ez duela eragozpenik. Desabantaila horietako bat kontsulta analitikoak idazteko zailtasuna da. Kontsultek JOIN kopuru handia dute, kodea luzea eta astuna da. Halaber, DATA VAULT-ek sartzen diren datuek ez dute inolako eraldatzerik jasaten, beraz, negozioaren ikuspuntutik, DATA VAULTek bere forma hutsean ez du balio absoluturik.

Gabezia horiek kentzeko DATA VAULT metodologia zabaldu zen, besteak beste, elementu hauekin:

  • PIT (denbora puntuan) taulak;
  • BRIDGE mahaiak;
  • AURREDEFINIZITAKO ERATORPENAK.

Ikus ditzagun elementu hauen helburua hurbilagotik.

PIT taulak

Normalean, negozio-entitate batek (HUB) eguneratze-tasa desberdinak dituzten datuak eduki ditzake; adibidez, pertsona bat ezaugarritzen duten datuei buruz ari bagara, esan dezakegu telefono-zenbaki bati, helbide edo posta elektroniko bati buruzko informazioak eguneratze-tasa handiagoa duela esatea baino, izen-abizenak, pasaportearen datuak, egoera zibila edo sexua.

Horregatik, sateliteak zehazterakoan, haien eguneratze-maiztasuna kontuan izan behar duzu. Zergatik da garrantzitsua?

Eguneratze-tasa desberdinak dituzten atributuak gordetzen badituzu taula berean, errenkada bat gehitu beharko diozu taulari gehien aldatzen den atributua eguneratzen den bakoitzean. Ondorioz, diskoko espazioa handitzea eta kontsultaren exekuzio denbora areagotzea da.

Orain sateliteak eguneratze-maiztasunaren arabera banatu ditugu eta datuak modu independentean karga ditzakegula, ziurtatu beharko genuke datu eguneratuak jaso ditzakegula. Hobe, beharrezkoak ez diren JOIN-ak erabili gabe.

Azal dezadan, adibidez, eguneratze tasa desberdinak dituzten sateliteetatik uneko informazioa (azken eguneratzearen dataren arabera) lortu behar duzula. Horretarako, JOIN bat egiteaz gain, hainbat kontsulta habiaratu ere sortu beharko dituzu (informazioa duen satelite bakoitzeko) gehienezko eguneratze data MAX (Eguneratze Data) hautatuta. JOIN berri bakoitzarekin, halako kodea hazten da eta oso azkar ulertzea zaila da.

PIT taula horrelako kontsultak errazteko diseinatuta dago; PIT taulak DATA VAULT-en datu berriak idaztearekin batera betetzen dira. PIT taula:

DATA VAULT-en garapena eta BUSINESS DATA VAULT-ra igarotzea

Hala, une bakoitzean satelite guztien datuek duten garrantziari buruzko informazioa dugu. PIT taulan JOIN-ak erabiliz, habiaraturiko kontsultak guztiz ezaba ditzakegu, jakina, PIT egunero bete eta hutsunerik gabe. PITean hutsuneak egon arren, azken datuak lor ditzakezu PIT berari habiatutako kontsulta bakarra erabiliz. Habiaratutako kontsulta batek satelite bakoitzari habiatutako kontsultak baino azkarrago prozesatuko ditu.

ZUBIA

BRIDGE taulak kontsulta analitikoak errazteko ere erabiltzen dira. Hala ere, PIT-tik ezberdintzen dena hainbat hub, esteka eta haien sateliteen arteko eskaerak sinplifikatzeko eta bizkortzeko bitartekoa da.

Taulak satelite guztientzako beharrezko gako guztiak ditu, kontsultetan askotan erabiltzen direnak. Horrez gain, behar izanez gero, hashed negozio-gakoak testu formako gakoekin osa daitezke, gakoen izenak aztertzeko behar badira.

Kontua da BRIDGE erabili gabe, hub ezberdinetako sateliteetan kokatutako datuak jasotzeko prozesuan, sateliteen ez ezik, hubak lotzen dituzten loturen JOIN bat egitea beharrezkoa izango dela.

BRIDGE-ren presentzia edo eza biltegiratze-konfigurazioak eta kontsultaren exekuzio-abiadura optimizatu beharrak zehazten du. Zaila da BRIGEren adibide unibertsal bat etortzea.

AURREDEFINIZITAKO ERATORPENAK

NEGOZIO DATUEN GOBEGIRA hurbiltzen gaituen beste objektu mota bat aurrez kalkulatutako adierazleak dituzten taulak dira. Horrelako taulak benetan garrantzitsuak dira negozioarentzat; emandako arauen arabera bildutako informazioa dute eta nahiko erraza da sarbidea.

Arkitektorikoki, AURREZ DEFINITUTAKO ERATORKETAK hub jakin bateko beste satelite bat baino ez dira. Satelite arrunt batek bezala, negozio-gako bat eta erregistroaren sorrera-data ditu satelitean. Hor amaitzen dira, ordea, antzekotasunak. Horrelako satelite "espezializatu" baten atributuen osaera gehiago negozio erabiltzaileek zehazten dute aurrez kalkulatutako adierazle ezagunenetan oinarrituta.

Adibidez, langile bati buruzko informazioa duen zentro batek satelite bat izan dezake, hala nola adierazleak dituena:

  • Gutxieneko soldata;
  • Gehieneko soldata;
  • Batez besteko soldata;
  • Metatutako soldaten guztira, etab.

Logikoa da ERATORKETA AURREDEFINITIZATUAK zentro bereko PIT taulan sartzea, orduan langile baten datu zatiak erraz lor ditzakezu berariaz hautatutako data batean.

ONDORIOAK

Praktikak erakusten duen bezala, negozio-erabiltzaileek DATA VAULT erabiltzea zaila da hainbat arrazoirengatik:

  • Kontsulta kodea konplexua eta astuna da;
  • JOIN-en ugaritasunak kontsulten errendimenduan eragiten du;
  • Kontsulta analitikoak idazteak biltegiratze diseinuaren ezagutza bikaina eskatzen du.

Datuen sarbidea errazteko, DATA VAULT objektu gehigarriekin hedatzen da:

  • PIT (denbora puntuan) taulak;
  • BRIDGE mahaiak;
  • AURREDEFINIZITAKO ERATORPENAK.

Hurrengoa Artikulu Nire ustez, BIrekin lan egiten dutenentzat interesgarriena kontatzeko asmoa dut. DATA VAULT-en oinarritutako datu-taulak eta dimentsio-taulak sortzeko moduak aurkeztuko ditut.

Artikuluaren materialak honako hauetan oinarritzen dira:

  • On Argitalpena Kenta Graziano, deskribapen zehatzaz gain, eredu-diagramak biltzen dituena;
  • Liburua: "Datu-biltegi eskalagarria eraikitzen DATA VAULT 2.0-rekin";
  • artikulu Data Vault oinarriak.

Iturria: www.habr.com

Gehitu iruzkin berria