Data marts DATA VAULT

En l'anterior articles, hem vist els conceptes bàsics de DATA VAULT, estenent DATA VAULT a un estat més analitzable i creant un BUSINESS DATA VAULT. És hora d'acabar la sèrie amb el tercer article.

Com vaig anunciar a l'anterior Publicació, aquest article se centrarà en el tema de la BI, o més aviat la preparació de DATA VAULT com a font de dades per a BI. Vegem com crear taules de fets i dimensions i així crear un esquema estrella.

Quan vaig començar a estudiar materials en anglès sobre el tema de la creació de data marts amb DATA VAULT, vaig tenir la sensació que el procés era bastant complicat. Com que els articles són d'una extensió considerable, hi ha referències a canvis de redacció apareguts en la metodologia Data Vault 2.0, s'indica la importància d'aquestes redaccions.

Tanmateix, un cop aprofundit en la traducció, va quedar clar que aquest procés no és tan complicat. Però pots tenir una opinió diferent.

I doncs, anem al punt.

Taules de dimensions i fets a DATA VAULT

La informació més difícil d'entendre:

  • Les taules de mesura es construeixen a partir d'informació dels hubs i dels seus satèl·lits;
  • Les taules de fets es construeixen a partir de la informació dels enllaços i dels seus satèl·lits.

I això és obvi després de llegir l'article sobre Conceptes bàsics de DATA VAULT. Els concentradors emmagatzemen claus úniques d'objectes comercials, els seus satèl·lits lligats al temps de l'estat dels atributs dels objectes de negoci, els satèl·lits lligats a enllaços que donen suport a les transaccions emmagatzemen les característiques numèriques d'aquestes transaccions.

Aquí és on acaba bàsicament la teoria.

Però, tanmateix, al meu entendre, cal destacar un parell de conceptes que es poden trobar en articles sobre la metodologia DATA VAULT:

  • Raw Data Marts: aparadors de dades "crues";
  • Information Marts - aparadors d'informació.

El concepte de "Raw Data Marts": denota els mercats construïts sobre dades de DATA VAULT mitjançant la realització de JOIN bastant simples. L'enfocament "Raw Data Marts" us permet ampliar de manera flexible i ràpida el projecte de magatzem amb informació adequada per a l'anàlisi. Aquest enfocament no implica la realització de transformacions de dades complexes i l'execució de regles empresarials abans de ser col·locades a l'aparador, però, les dades de Raw Data Marts haurien de ser comprensibles per a l'usuari empresarial i haurien de servir com a base per a una transformació posterior, per exemple, amb eines de BI. .

El concepte de "Information Marts" va aparèixer a la metodologia Data Vault 2.0, va substituir l'antic concepte de "Data Marts". Aquest canvi es deu a la realització de la tasca d'implementar un model de dades per a la presentació d'informes com a transformació de dades en informació. L'esquema "Information Marts", en primer lloc, hauria de proporcionar a l'empresa la informació adequada per a la presa de decisions.

Les definicions més aviat pronunciades reflecteixen dos fets senzills:

  1. Les vitrines del tipus "Raw Data Marts" es construeixen sobre un DATA VAULT en brut (RAW), un repositori que conté només els conceptes bàsics: CENTROS, ENLLAÇOS, SATELLITS;
  2. Les vitrines "Information Marts" es construeixen utilitzant elements de BUSINESS VULT: PIT, BRIDGE.

Si passem a exemples d'emmagatzematge d'informació sobre un empleat, podem dir que una botiga que mostra el número de telèfon actual (actual) d'un empleat és una botiga del tipus "Raw Data Marts". Per formar aquest aparador, s'utilitzen la clau de negoci de l'empleat i la funció MAX() utilitzada a l'atribut de data de càrrega del satèl·lit (MAX(SatLoadDate)). Quan cal emmagatzemar l'historial de canvis d'atributs a l'aparador, s'utilitza, cal entendre a quina data fins a quina data estava actualitzat el telèfon, la compilació de la clau comercial i la data de càrrega al satèl·lit. afegirà la clau primària a aquesta taula, també s'afegeix el camp de la data de finalització del període de validesa.

La creació d'una botiga que emmagatzemi informació actualitzada per a cada atribut de diversos satèl·lits inclosos en el concentrador, per exemple, número de telèfon, adreça, nom complet, implica l'ús d'una taula PIT, a través de la qual és fàcil accedir a totes les dates. de rellevància. Les vitrines d'aquest tipus s'anomenen "Marts d'informació".

Tots dos enfocaments són rellevants tant per a les mesures com per als fets.

Per crear aparadors que emmagatzemen informació sobre diversos enllaços i concentradors, es pot implicar l'accés a les taules BRIDGE.

Amb aquest article, completo la sèrie sobre el concepte de DATA VAULT, espero que la informació que he compartit sigui útil per a la implementació dels vostres projectes.

Com sempre, per acabar, uns quants enllaços útils:

  • Article Kenta Graziano, que, a més d'una descripció detallada, conté diagrames de models;

Font: www.habr.com

Afegeix comentari