Data marts COFRE DE DADOS

Na anterior artigos, vimos os fundamentos do DATA VAULT, estendendo o DATA VAULT para um estado mais analisável e criando um BUSINESS DATA VAULT. É hora de encerrar a série com o terceiro artigo.

Como anunciei no anterior publicações, este artigo focará no tema BI, ou melhor, na preparação do DATA VAULT como fonte de dados para BI. Vejamos como criar tabelas de fatos e dimensões e, assim, criar um esquema em estrela.

Quando comecei a estudar materiais em inglês sobre o tema da criação de data marts em DATA VAULT, tive a sensação de que o processo era bastante complicado. Como os artigos são extensos, há referências a mudanças na redação que apareceram na metodologia do Data Vault 2.0, a importância dessas redações é indicada.

Porém, depois de mergulhar na tradução, ficou claro que esse processo não é tão complicado. Mas você pode ter uma opinião diferente.

E então, vamos ao que interessa.

Dimensões e tabelas de fatos no DATA VAULT

As informações mais difíceis de entender:

  • As tabelas de medição são construídas com base nas informações dos hubs e seus satélites;
  • As tabelas de fatos são construídas com base nas informações dos links e seus satélites.

E isso é óbvio depois de ler o artigo sobre Noções básicas do COFRE DE DADOS. Os hubs armazenam chaves exclusivas de objetos de negócios, seus satélites com limite de tempo do estado dos atributos do objeto de negócios, satélites vinculados a links que suportam transações armazenam as características numéricas dessas transações.

É aqui que a teoria basicamente termina.

Mas, no entanto, na minha opinião, é necessário observar alguns conceitos que podem ser encontrados em artigos sobre a metodologia DATA VAULT:

  • Raw Data Marts - vitrines de dados "brutos";
  • Information Marts - vitrines de informações.

O conceito de "Raw Data Marts" - denota marts construídos sobre dados DATA VAULT executando JOINs bastante simples. A abordagem “Raw Data Marts” permite expandir de forma flexível e rápida o projeto de warehouse com informações adequadas para análise. Essa abordagem não envolve a realização de transformações complexas de dados e a execução de regras de negócios antes de serem colocados na vitrine, no entanto, os dados brutos dos Data Marts devem ser compreensíveis para o usuário comercial e devem servir de base para transformações posteriores, por exemplo, por ferramentas de BI .

O conceito de “Information Marts” surgiu na metodologia Data Vault 2.0, substituiu o antigo conceito de “Data Marts”. Esta mudança deve-se à concretização da tarefa de implementação de um modelo de dados para reporte como transformação de dados em informação. O esquema “Information Marts”, antes de tudo, deve fornecer ao negócio informações adequadas para a tomada de decisões.

Definições bastante prolixo refletem dois fatos simples:

  1. As vitrines do tipo “Raw Data Marts” são construídas sobre um DATA VAULT bruto (RAW), um repositório contendo apenas os conceitos básicos: HUBS, LINKS, SATÉLITES;
  2. As vitrines "Information Marts" são construídas usando elementos do BUSINESS VAULT: PIT, BRIDGE.

Se nos voltarmos para exemplos de armazenamento de informações sobre um funcionário, podemos dizer que uma vitrine que exibe o número de telefone atual (atual) de um funcionário é uma vitrine do tipo “Raw Data Marts”. Para formar tal vitrine, são usadas a chave de negócios do funcionário e a função MAX() usada no atributo de data de carregamento do satélite (MAX(SatLoadDate)). Quando é necessário armazenar o histórico de alterações de atributos na vitrine - é usado, você precisa entender a partir de que data o telefone foi atualizado, a compilação da chave comercial e a data de carregamento para o satélite adicionará a chave primária a tal tabela, o campo da data final do período de validade também será adicionado.

A criação de uma vitrine que armazene informações atualizadas de cada atributo dos vários satélites incluídos no hub, por exemplo, número de telefone, endereço, nome completo, implica o uso de uma tabela PIT, através da qual é fácil acessar todas as datas de relevância. Vitrines desse tipo são chamadas de "Informações Marts".

Ambas as abordagens são relevantes tanto para medições quanto para fatos.

Para criar vitrines que armazenam informações sobre diversos links e hubs, pode-se utilizar o acesso às tabelas BRIDGE.

Com este artigo encerro o ciclo sobre o conceito de DATA VAULT, espero que a informação que partilhei seja útil na concretização dos vossos projetos.

Como sempre, para concluir, alguns links úteis:

  • Artigo Kenta Graziano, que, além de uma descrição detalhada, contém diagramas modelo;

Fonte: habr.com

Adicionar um comentário