Data marts BÓVEDA DE DATOS

En anteriores artículos, hemos visto los conceptos básicos de DATA VAULT, extendiendo DATA VAULT a un estado más analizable y creando un BUSINESS DATA VAULT. Es hora de terminar la serie con el tercer artículo.

Como anuncié en el anterior Publicación, este artículo se centrará en el tema de BI, o más bien en la preparación de DATA VAULT como fuente de datos para BI. Veamos cómo crear tablas de hechos y dimensiones y, por lo tanto, crear un esquema en estrella.

Cuando comencé a estudiar materiales en inglés sobre el tema de la creación de mercados de datos sobre DATA VAULT, tuve la sensación de que el proceso era bastante complicado. Dado que los artículos son de considerable extensión, hay referencias a cambios en la redacción que apareció en la metodología Data Vault 2.0, se indica la importancia de estas redacciones.

Sin embargo, al profundizar en la traducción, quedó claro que este proceso no es tan complicado. Pero usted puede tener una opinión diferente.

Y así, vayamos al grano.

Tablas de dimensiones y hechos en DATA VAULT

La información más difícil de entender:

  • Las tablas de medición se basan en la información de los centros y sus satélites;
  • Las tablas de hechos se basan en información de enlaces y sus satélites.

Y esto es obvio después de leer el artículo sobre Conceptos básicos de BÓVEDA DE DATOS. Los concentradores almacenan claves únicas de objetos comerciales, sus satélites con límite de tiempo del estado de los atributos de los objetos comerciales, los satélites vinculados a enlaces que respaldan transacciones almacenan las características numéricas de estas transacciones.

Aquí es donde básicamente termina la teoría.

Pero, sin embargo, en mi opinión, es necesario señalar un par de conceptos que se pueden encontrar en artículos sobre la metodología DATA VAULT:

  • Raw Data Marts: escaparates de datos "sin procesar";
  • Information Marts - vitrinas de información.

El concepto de "mercados de datos sin procesar": denota mercados construidos sobre datos de DATA VAULT mediante la realización de JOIN bastante simples. El enfoque de "Centro de datos sin procesar" le permite expandir de manera flexible y rápida el proyecto de almacén con información adecuada para el análisis. Este enfoque no implica realizar transformaciones de datos complejas ni ejecutar reglas comerciales antes de colocarlos en el escaparate; sin embargo, los datos de Raw Data Marts deben ser comprensibles para el usuario comercial y deben servir como base para una mayor transformación, por ejemplo, mediante herramientas de BI. .

El concepto de “Information Marts” apareció en la metodología Data Vault 2.0, reemplazó al antiguo concepto de “Data Marts”. Este cambio se debe a la realización de la tarea de implementar un modelo de datos para el reporte como una transformación de datos en información. El esquema de “Information Marts”, en primer lugar, debe proporcionar al negocio información adecuada para la toma de decisiones.

Las definiciones bastante prolijas reflejan dos hechos simples:

  1. Las vitrinas del tipo "Cruceros de datos sin procesar" se construyen sobre una BÓVEDA DE DATOS sin procesar (RAW), un depósito que contiene solo los conceptos básicos: CENTROS, ENLACES, SATÉLITES;
  2. Las vitrinas "Information Marts" se construyen utilizando elementos de BUSINESS VAULT: PIT, BRIDGE.

Si recurrimos a ejemplos de almacenamiento de información sobre un empleado, podemos decir que un escaparate que muestra el número de teléfono actual (actual) de un empleado es un escaparate del tipo "Raw Data Marts". Para formar un escaparate de este tipo, se utilizan la clave comercial del empleado y la función MAX() utilizada en el atributo de fecha de carga del satélite (MAX(SatLoadDate)). Cuando se requiere almacenar el historial de cambios de atributos en el escaparate: se usa, debe comprender desde qué fecha se actualizó el teléfono, la compilación de la clave comercial y la fecha de carga al satélite. agregará la clave principal a dicha tabla, también se agregará el campo de la fecha de finalización del período de validez.

Crear un escaparate que almacene información actualizada para cada atributo de varios satélites incluidos en el concentrador, por ejemplo, número de teléfono, dirección, nombre completo, implica el uso de una tabla PIT, a través de la cual es fácil acceder a todas las fechas. de relevancia Las vitrinas de este tipo se denominan "mercados de información".

Ambos enfoques son relevantes tanto para las mediciones como para los hechos.

Para crear escaparates que almacenen información sobre varios enlaces y concentradores, se puede involucrar el acceso a las tablas BRIDGE.

Con este artículo completo la serie sobre el concepto de DATA VAULT, espero que la información que les comparto les sea de utilidad en la implementación de sus proyectos.

Como siempre, en conclusión, algunos enlaces útiles:

  • Статья Kenta Graziano, que, además de una descripción detallada, contiene diagramas de modelos;

Fuente: habr.com

Añadir un comentario