Data marts DATA VAULT

En anteriores artigos, vimos os conceptos básicos de DATA VAULT, estendendo DATA VAULT a un estado máis analizable e creando un BUSINESS DATA VAULT. É hora de rematar a serie co terceiro artigo.

Como xa anunciei no anterior Publicación, este artigo centrarase no tema da BI, ou máis ben na preparación de DATA VAULT como fonte de datos para BI. Vexamos como crear táboas de feitos e dimensións e así crear un esquema en estrela.

Cando comecei a estudar materiais en inglés sobre o tema da creación de data marts sobre DATA VAULT, tiven a sensación de que o proceso era bastante complicado. Dado que os artigos son de considerable extensión, hai referencias a cambios na redacción que apareceron na metodoloxía Data Vault 2.0, indícase a importancia destas redaccións.

Porén, afondando na tradución, quedou claro que este proceso non é tan complicado. Pero podes ter unha opinión diferente.

E así, imos ao grano.

Táboas de dimensións e feitos en DATA VULT

A información máis difícil de entender:

  • As táboas de medición están construídas a partir da información dos hubs e dos seus satélites;
  • As táboas de datos están construídas a partir da información dos enlaces e dos seus satélites.

E isto é obvio despois de ler o artigo sobre Conceptos básicos de DATA VAULT. Os concentradores almacenan claves únicas de obxectos comerciais, os seus satélites limitados no tempo do estado dos atributos do obxecto de negocio, os satélites ligados a ligazóns que admiten transaccións almacenan as características numéricas destas transaccións.

Aquí é onde remata basicamente a teoría.

Pero, con todo, na miña opinión, cómpre sinalar un par de conceptos que se poden atopar nos artigos sobre a metodoloxía DATA VAULT:

  • Raw Data Marts: vitrinas de datos "en bruto";
  • Information Marts - escaparates de información.

O concepto de "Raw Data Marts" - denota mercados construídos sobre datos de DATA VAULT mediante a realización de JOINs bastante sinxelos. O enfoque "Raw Data Marts" permítelle ampliar de forma flexible e rápida o proxecto de almacén con información adecuada para a súa análise. Este enfoque non implica realizar transformacións de datos complexas e executar regras comerciais antes de colocarse no escaparate, non obstante, os datos de Raw Data Marts deben ser comprensibles para o usuario empresarial e deben servir de base para unha maior transformación, por exemplo, mediante ferramentas de BI. .

O concepto de "Information Marts" apareceu na metodoloxía Data Vault 2.0, substituíu o antigo concepto de "Data Marts". Este cambio débese á realización da tarefa de implantar un modelo de datos para o informe como transformación de datos en información. O esquema "Information Marts", en primeiro lugar, debe proporcionar á empresa información adecuada para a toma de decisións.

As definicións máis ben prolixas reflicten dous feitos sinxelos:

  1. As vitrinas do tipo "Raw Data Marts" están construídas sobre unha BÓVEDA DE DATOS RAW (RAW), un repositorio que só contén os conceptos básicos: CENTROS, ENLACES, SATÉLITES;
  2. As vitrinas "Information Marts" constrúense utilizando elementos de BUSINESS VULT: PIT, BRIDGE.

Se consultamos exemplos de almacenamento de información sobre un empregado, podemos dicir que un escaparate que mostra o número de teléfono actual (actual) dun empregado é un escaparate do tipo "Raw Data Marts". Para formar un escaparate deste tipo, utilízanse a clave comercial do empregado e a función MAX() utilizada no atributo da data de carga do satélite (MAX(SatLoadDate)). Cando se require almacenar o historial de cambios de atributos no escaparate - utilízase, cómpre comprender desde que data ata que data estivo actualizado o teléfono, a compilación da clave comercial e a data de carga para o satélite engadirá a clave primaria a tal táboa, tamén se engade o campo da data de finalización do período de validez.

Crear un escaparate que almacene información actualizada para cada atributo de varios satélites incluídos no hub, por exemplo, número de teléfono, enderezo, nome completo, implica o uso dunha táboa PIT, a través da cal é fácil acceder a todas as datas. de relevancia. As vitrinas deste tipo denomínanse "Information Marts".

Ambos enfoques son relevantes tanto para medicións como para feitos.

Para crear escaparates que almacenen información sobre varias ligazóns e centros, pódese utilizar o acceso ás táboas BRIDGE.

Con este artigo, remato o ciclo sobre o concepto de DATA VAULT, espero que a información que compartín sexa útil para a posta en marcha dos teus proxectos.

Como sempre, para rematar, algúns enlaces útiles:

  • Artigo Kenta Graziano, que, ademais dunha descrición detallada, contén diagramas de modelos;

Fonte: www.habr.com

Engadir un comentario