データマート データボールト

以前は 記事では、DATA VAULT の基本、DATA VAULT をより解析可能な状態に拡張し、BUSINESS DATA VAULT を作成する方法について説明しました。 XNUMX 回目の記事でシリーズを終了するときが来ました。

前回お知らせしたように 出版物、この記事では BI のトピック、つまり BI のデータ ソースとしての DATA VAULT の準備に焦点を当てます。 ファクトテーブルとディメンションテーブルを作成してスタースキーマを作成する方法を見てみましょう。

DATA VAULT 上でデータ マートを作成するというテーマについて英語の資料を勉強し始めたとき、そのプロセスはかなり複雑であると感じました。 記事はかなり長いため、Data Vault 2.0 の方法論に登場した文言の変更についての言及があり、これらの文言の重要性が示されています。

しかし、翻訳を詳しく調べてみると、このプロセスはそれほど複雑ではないことが明らかになりました。 しかし、あなたは違う意見を持っているかもしれません。

それでは本題に入りましょう。

DATA VAULT のディメンション テーブルとファクト テーブル

理解するのが最も難しい情報:

  • 測定テーブルは、ハブとその衛星からの情報に基づいて構築されます。
  • ファクト テーブルは、リンクとそのサテライトからの情報に基づいて構築されます。

そして、これは次の記事を読むと明らかです データ保管庫の基本。 ハブにはビジネス オブジェクトの一意のキーが格納され、ハブにはビジネス オブジェクト属性の状態の時間制限されたサテライトが格納され、トランザクションをサポートするリンクに関連付けられたサテライトには、これらのトランザクションの数値特性が格納されます。

これで理論は基本的に終わります。

しかし、それでもなお、私の意見では、DATA VAULT 方法論に関する記事で見られるいくつかの概念に注意する必要があります。

  • Raw Data Marts - 「生」データのショーケース。
  • Information Marts - 情報ショーケース。

「Raw Data Mart」の概念 - 非常に単純な JOIN を実行することによって DATA VAULT データ上に構築されたマートを意味します。 「Raw Data Marts」アプローチにより、分析に適した情報を使用してウェアハウス プロジェクトを柔軟かつ迅速に拡張できます。 このアプローチには、店頭に並べる前に複雑なデータ変換を実行したり、ビジネス ルールを実行したりする必要はありませんが、Raw Data Mart データはビジネス ユーザーにとって理解しやすく、たとえば BI ツールによるさらなる変換の基礎として機能する必要があります。 。

「情報マート」の概念は Data Vault 2.0 方法論で登場し、古い概念「データ マート」に取って代わりました。 この変更は、データを情報に変換するレポート用のデータ モデルを実装するというタスクの実現によるものです。 「情報マート」の仕組みでは、まず企業の意思決定に適した情報を提供する必要がある。

やや冗長な定義は、次の XNUMX つの単純な事実を反映しています。

  1. 「Raw Data Mart」タイプのショーケースは、ハブ、リンク、サテライトといった基本概念のみを含むリポジトリである未加工 (RAW) DATA VAULT 上に構築されます。
  2. ショーケース「インフォメーションマート」は、BUSINESS VAULTの要素であるPIT、BRIDGEを使用して構築されています。

従業員に関する情報を保存する例に目を向けると、従業員の現在 (現在の) 電話番号を表示するストアフロントは、「Raw Data Marts」タイプのストアフロントであると言えます。 このようなショーケースを形成するには、従業員のビジネス キーと衛星搭載日属性で使用される MAX() 関数 (MAX(SatLoadDate)) が使用されます。 属性変更の履歴をショーケースに保存する必要がある場合に使用されます。電話機がいつからどの日付まで最新であったか、ビジネス キーの編集とサテライトへのアップロード日を理解する必要があります。このようなテーブルに主キーを追加すると、有効期間の終了日のフィールドも追加されます。

ハブに含まれる複数の衛星の各属性 (電話番号、住所、氏名など) の最新情報を保存するストアフロントを作成すると、すべての日付に簡単にアクセスできる PIT テーブルの使用が意味されます。関連性のあるもの。 このようなショーケースを「インフォメーションマート」と呼びます。

どちらのアプローチも、測定と事実の両方に関連します。

複数のリンクとハブに関する情報を保存するストアフロントを作成するには、BRIDGE テーブルへのアクセスを使用できます。

この記事で、DATA VAULT の概念に関するサイクルを完了します。私が共有した情報があなたのプロジェクトの実装に役立つことを願っています。

いつものように、結論として、役立つリンクをいくつか紹介します。

  • 記事 Kenta Graziano、詳細な説明に加えて、モデル図が含まれています。

出所: habr.com

コメントを追加します