數據集市 DATA VAULT

在以前 文章,我們已經了解了 DATA VAULT 的基礎知識,將 DATA VAULT 擴展到更可解析的狀態,並創建了 BUSINESS DATA VAULT。 是時候用第三篇文章結束這個系列了。

正如我在之前宣布的 發表,本文將重點討論 BI 主題,或者更確切地說,準備 DATA VAULT 作為 BI 的數據源。 讓我們看看如何創建事實表和維度表,從而創建星型模式。

當我開始學習關於在 DATA VAULT 上創建數據集市的英文資料時,我感覺這個過程相當複雜。 由於文章篇幅相當長,其中提到了 Data Vault 2.0 方法中出現的措辭變化,表明了這些措辭的重要性。

然而,深入研究翻譯後,很明顯這個過程並沒有那麼複雜。 但你可能有不同的看法。

因此,讓我們進入正題。

DATA VAULT 中的維度表和事實表

最難理解的信息:

  • 測量表建立在來自樞紐及其衛星的信息之上;
  • 事實表建立在來自鏈接及其衛星的信息之上。

在閱讀有關的文章後,這是顯而易見的 數據倉庫基礎知識. 集線器存儲業務對象的唯一鍵,它們的業務對象屬性狀態的時限衛星,與支持交易的鏈接相關的衛星存儲這些交易的數字特徵。

這是該理論基本結束的地方。

但是,儘管如此,在我看來,有必要注意一些可以在有關 DATA VAULT 方法的文章中找到的概念:

  • 原始數據集市——展示“原始”數據;
  • Information Marts - 信息展示。

“原始數據集市”的概念 - 表示通過執行相當簡單的 JOIN 在 DATA VAULT 數據上構建的集市。 “原始數據集市”方法允許您使用適合分析的信息靈活快速地擴展倉庫項目。 這種方法不涉及在放入店面之前執行複雜的數據轉換和執行業務規則,但是,原始數據集市數據應該是業務用戶可以理解的,並且應該作為進一步轉換的基礎,例如,通過 BI 工具.

“信息集市”的概念出現在Data Vault 2.0方法論中,它取代了舊的“數據集市”概念。 此更改是由於實現了將數據模型轉換為信息的報告任務。 “信息集市”方案首先應該為企業提供適合決策的信息。

相當冗長的定義反映了兩個簡單的事實:

  1. “原始數據集市”類型的展示建立在原始 (RAW) 數據倉庫之上,這是一個僅包含基本概念的存儲庫:HUBS、LINKS、SATELLITES;
  2. 展示“信息集市”是使用 BUSINESS VAULT 的元素構建的:PIT、BRIDGE。

如果我們轉向存儲員工信息的示例,我們可以說顯示員工當前(當前)電話號碼的店面是“原始數據集市”類型的店面。 為了形成這樣的展示,使用了員工的業務密鑰和用於衛星加載日期屬性 (MAX(SatLoadDate)) 的 MAX() 函數。 當需要在 showcase 中存儲屬性更改的歷史記錄時 - 使用它時,您需要了解電話是從哪一天到哪一天是最新的,業務密鑰的編譯和上傳到衛星的日期將主鍵添加到這樣的表中,還添加了有效期結束日期的字段。

創建一個存儲中心包含的多個衛星的每個屬性的最新信息的店面,例如電話號碼、地址、全名,意味著使用 PIT 表,通過它可以輕鬆訪問所有日期相關的。 這種類型的陳列櫃被稱為“信息集市”。

這兩種方法都與測量和事實相關。

要創建存儲有關多個鏈接和中心的信息的店面,可能涉及對 BRIDGE 表的訪問。

通過本文,我完成了有關 DATA VAULT 概念的系列文章,希望我分享的信息對您的項目實施有用。

一如既往,總結一下,一些有用的鏈接:

  • 文章 Kenta Graziano,除了詳細描述外,還包含模型圖;

來源: www.habr.com

添加評論