在以前
正如我在之前宣布的
当我开始学习关于在 DATA VAULT 上创建数据集市的英文资料时,我感觉这个过程相当复杂。 由于文章篇幅相当长,其中提到了 Data Vault 2.0 方法中出现的措辞变化,表明了这些措辞的重要性。
然而,深入研究翻译后,很明显这个过程并没有那么复杂。 但你可能有不同的看法。
DATA VAULT 中的维度表和事实表
最难理解的信息:
- 测量表建立在来自枢纽及其卫星的信息之上;
- 事实表建立在来自链接及其卫星的信息之上。
在阅读有关的文章后,这是显而易见的
这是该理论基本结束的地方。
但是,尽管如此,在我看来,有必要注意一些可以在有关 DATA VAULT 方法的文章中找到的概念:
- 原始数据集市——展示“原始”数据;
- Information Marts - 信息展示。
“原始数据集市”的概念 - 表示通过执行相当简单的 JOIN 在 DATA VAULT 数据上构建的集市。 “原始数据集市”方法允许您使用适合分析的信息灵活快速地扩展仓库项目。 这种方法不涉及在放入店面之前执行复杂的数据转换和执行业务规则,但是,原始数据集市数据应该是业务用户可以理解的,并且应该作为进一步转换的基础,例如,通过 BI 工具.
“信息集市”的概念出现在Data Vault 2.0方法论中,它取代了旧的“数据集市”概念。 此更改是由于实现了将数据模型转换为信息的报告任务。 “信息集市”方案首先应该为企业提供适合决策的信息。
相当冗长的定义反映了两个简单的事实:
- “原始数据集市”类型的展示建立在原始 (RAW) 数据仓库之上,这是一个仅包含基本概念的存储库:HUBS、LINKS、SATELLITES;
- 展示“信息集市”是使用 BUSINESS VAULT 的元素构建的:PIT、BRIDGE。
如果我们转向存储员工信息的示例,我们可以说显示员工当前(当前)电话号码的店面是“原始数据集市”类型的店面。 为了形成这样的展示,使用了员工的业务密钥和用于卫星加载日期属性 (MAX(SatLoadDate)) 的 MAX() 函数。 需要在showcase中存储属性变化的历史时——使用它,你需要了解手机是从哪天到哪天更新的,业务密钥的编译和加载到的日期卫星将主键添加到这样的表中,还添加了有效期结束日期的字段。
创建一个存储中心包含的多个卫星的每个属性的最新信息的店面,例如电话号码、地址、全名,意味着使用 PIT 表,通过它可以轻松访问所有日期相关的。 这种类型的陈列柜被称为“信息集市”。
这两种方法都与测量和事实相关。
要创建存储有关多个链接和中心的信息的店面,可以使用对 BRIDGE 表的访问。
通过这篇文章,我完成了 DATA VAULT 概念的循环,我希望我分享的信息对您的项目实施有用。
一如既往,总结一下,一些有用的链接:
Статья Kenta Graziano,除了详细描述外,还包含模型图;
- 书籍:“使用 DATA VAULT 2.0 构建可扩展的数据仓库”;
文章“Data Vault 基础知识” ;文章“DATA VAULT 的开发和向 BUSINESS DATA VAULT 的过渡” .
来源: habr.com