Data Marts DATA VAULT

In früheren Artikelhaben wir die Grundlagen von DATA VAULT kennengelernt, DATA VAULT auf einen besser analysierbaren Zustand erweitert und einen BUSINESS DATA VAULT erstellt. Es ist Zeit, die Serie mit dem dritten Artikel zu beenden.

Wie ich bereits im Vorfeld angekündigt habe VeröffentlichungIn diesem Artikel geht es um das Thema BI bzw. die Vorbereitung von DATA VAULT als Datenquelle für BI. Schauen wir uns an, wie man Fakten- und Dimensionstabellen erstellt und so ein Sternschema erstellt.

Als ich anfing, englischsprachige Materialien zum Thema der Erstellung von Data Marts über DATA VAULT zu studieren, hatte ich das Gefühl, dass der Prozess ziemlich kompliziert war. Da die Artikel von beträchtlicher Länge sind, gibt es Hinweise auf Änderungen in den Formulierungen, die in der Data Vault 2.0-Methodik erschienen sind. Auf die Bedeutung dieser Formulierungen wird hingewiesen.

Bei genauerer Betrachtung der Übersetzung wurde jedoch klar, dass dieser Prozess nicht so kompliziert ist. Aber vielleicht sind Sie anderer Meinung.

Kommen wir also zum Punkt.

Dimensions- und Faktentabellen in DATA VAULT

Die am schwierigsten zu verstehenden Informationen:

  • Messtabellen basieren auf Informationen von Hubs und ihren Satelliten.
  • Faktentabellen basieren auf Informationen von Links und ihren Satelliten.

Und das ist offensichtlich, nachdem man den Artikel darüber gelesen hat DATA VAULT-Grundlagen. Hubs speichern eindeutige Schlüssel von Geschäftsobjekten, ihre zeitgebundenen Satelliten des Zustands von Geschäftsobjektattributen und Satelliten, die an Links zur Unterstützung von Transaktionen gebunden sind, speichern die numerischen Merkmale dieser Transaktionen.

Hier endet die Theorie im Grunde.

Dennoch ist es meiner Meinung nach dennoch notwendig, einige Konzepte zu beachten, die in Artikeln über die DATA VAULT-Methodik zu finden sind:

  • Raw Data Marts – Schaukästen mit „Rohdaten“;
  • Information Marts – Informationsvitrinen.

Das Konzept der „Raw Data Marts“ bezeichnet Marts, die über DATA VAULT-Daten durch die Durchführung relativ einfacher JOINs erstellt werden. Der „Raw Data Marts“-Ansatz ermöglicht es Ihnen, das Warehouse-Projekt flexibel und schnell um analysetaugliche Informationen zu erweitern. Bei diesem Ansatz müssen keine komplexen Datentransformationen durchgeführt und Geschäftsregeln ausgeführt werden, bevor sie in der Storefront platziert werden. Allerdings sollten die Raw Data Marts-Daten für den Geschäftsbenutzer verständlich sein und als Grundlage für weitere Transformationen, beispielsweise durch BI-Tools, dienen .

Das Konzept der „Information Marts“ tauchte in der Data Vault 2.0-Methodik auf und ersetzte das alte Konzept der „Data Marts“. Diese Änderung ist auf die Verwirklichung der Aufgabe zurückzuführen, ein Datenmodell für die Berichterstattung als Umwandlung von Daten in Informationen zu implementieren. Das „Information Marts“-System soll in erster Linie dem Unternehmen entscheidungsrelevante Informationen liefern.

Ziemlich wortreiche Definitionen spiegeln zwei einfache Tatsachen wider:

  1. Showcases vom Typ „Raw Data Marts“ basieren auf einem Rohdatentresor (RAW), einem Repository, das nur die Grundkonzepte enthält: HUBS, LINKS, SATELLITEN;
  2. Vitrinen „Information Marts“ werden mit Elementen von BUSINESS VAULT: PIT, BRIDGE gebaut.

Wenn wir uns Beispiele für die Speicherung von Informationen über einen Mitarbeiter zuwenden, können wir sagen, dass eine Storefront, die die aktuelle (aktuelle) Telefonnummer eines Mitarbeiters anzeigt, eine Storefront vom Typ „Raw Data Marts“ ist. Um einen solchen Schaukasten zu bilden, werden der Geschäftsschlüssel des Mitarbeiters und die Funktion MAX() verwendet, die für das Satellitenladedatumsattribut (MAX(SatLoadDate)) verwendet wird. Wenn es erforderlich ist, den Verlauf der Attributänderungen im Showcase zu speichern, müssen Sie verstehen, von welchem ​​Datum bis zu welchem ​​Datum das Telefon auf dem neuesten Stand war, den Geschäftsschlüssel erstellt und das Upload-Datum auf den Satelliten gespeichert haben Fügt den Primärschlüssel zu einer solchen Tabelle hinzu, wird auch das Feld des Enddatums des Gültigkeitszeitraums hinzugefügt.

Das Erstellen einer Storefront, die aktuelle Informationen für jedes Attribut mehrerer im Hub enthaltener Satelliten speichert, z. B. Telefonnummer, Adresse, vollständiger Name, erfordert die Verwendung einer PIT-Tabelle, über die leicht auf alle Daten zugegriffen werden kann von Relevanz. Schaukästen dieser Art werden als „Information Marts“ bezeichnet.

Beide Ansätze sind sowohl für Messungen als auch für Fakten relevant.

Um Storefronts zu erstellen, die Informationen über mehrere Links und Hubs speichern, kann der Zugriff auf BRIDGE-Tabellen genutzt werden.

Mit diesem Artikel schließe ich die Reihe zum Konzept des DATA VAULT ab und hoffe, dass die von mir geteilten Informationen bei der Umsetzung Ihrer Projekte nützlich sein werden.

Wie immer zum Abschluss noch ein paar nützliche Links:

  • Artikel Kenta Graziano, das neben einer detaillierten Beschreibung auch Modelldiagramme enthält;

Source: habr.com

Kommentar hinzufügen