ดาต้ามาร์ท DATA Vault

ในก่อนหน้านี้ บทความเราได้เห็นพื้นฐานของ DATA VAULT การขยาย DATA VAULT ไปสู่สถานะที่แยกวิเคราะห์ได้มากขึ้น และสร้าง BUSINESS DATA VAULT ถึงเวลาจบซีรีส์ด้วยบทความที่สาม

ตามที่ได้ประกาศไปในตอนที่แล้ว สิ่งพิมพ์บทความนี้จะมุ่งเน้นไปที่หัวข้อของ BI หรือมากกว่าการเตรียม DATA VAULT เป็นแหล่งข้อมูลสำหรับ BI มาดูวิธีสร้างตารางแฟคท์และไดเมนชัน และสร้างสคีมาแบบดาว

เมื่อฉันเริ่มศึกษาเนื้อหาภาษาอังกฤษในหัวข้อการสร้างดาต้ามาร์ทผ่าน DATA VAULT ฉันรู้สึกว่ากระบวนการนี้ค่อนข้างซับซ้อน เนื่องจากบทความมีความยาวมาก จึงมีการอ้างอิงถึงการเปลี่ยนแปลงถ้อยคำที่ปรากฏในระเบียบวิธี Data Vault 2.0 จึงมีการระบุถึงความสำคัญของข้อความเหล่านี้

อย่างไรก็ตามเมื่อเจาะลึกการแปลก็เห็นได้ชัดว่ากระบวนการนี้ไม่ซับซ้อนนัก แต่คุณอาจมีความคิดเห็นที่แตกต่างออกไป

เรามาเข้าประเด็นกันเลย

ตารางมิติข้อมูลและข้อเท็จจริงใน DATA Vault

ข้อมูลที่เข้าใจยากที่สุด:

  • ตารางการวัดสร้างขึ้นจากข้อมูลจากฮับและดาวเทียม
  • ตารางข้อเท็จจริงสร้างขึ้นจากข้อมูลจากลิงก์และดาวเทียม

และนี่ชัดเจนหลังจากอ่านบทความเกี่ยวกับ พื้นฐานของ DATA Vault. ฮับจัดเก็บคีย์เฉพาะของวัตถุทางธุรกิจ ดาวเทียมที่มีขอบเขตเวลาของสถานะของแอตทริบิวต์ของวัตถุธุรกิจ ดาวเทียมที่เชื่อมโยงกับลิงก์ที่สนับสนุนธุรกรรมจะจัดเก็บลักษณะตัวเลขของธุรกรรมเหล่านี้

นี่คือจุดสิ้นสุดของทฤษฎี

แต่อย่างไรก็ตาม ในความคิดของฉัน จำเป็นต้องทราบแนวคิดสองสามข้อที่สามารถพบได้ในบทความเกี่ยวกับวิธีการของ DATA Vault:

  • Raw Data Marts - แสดงข้อมูล "ดิบ";
  • Information Marts - ตู้โชว์ข้อมูล

แนวคิดของ "Raw Data Marts" - หมายถึง marts ที่สร้างขึ้นเหนือข้อมูล DATA VAULT โดยทำการ JOIN ที่ค่อนข้างง่าย แนวทาง “Raw Data Marts” ช่วยให้คุณขยายโครงการคลังสินค้าได้อย่างยืดหยุ่นและรวดเร็วด้วยข้อมูลที่เหมาะสมสำหรับการวิเคราะห์ วิธีการนี้ไม่เกี่ยวข้องกับการดำเนินการแปลงข้อมูลที่ซับซ้อนและการดำเนินการกฎทางธุรกิจก่อนที่จะนำไปวางที่หน้าร้าน อย่างไรก็ตาม ข้อมูล Raw Data Marts ควรเข้าใจได้สำหรับผู้ใช้ทางธุรกิจ และควรทำหน้าที่เป็นพื้นฐานสำหรับการเปลี่ยนแปลงต่อไป เช่น โดยเครื่องมือ BI .

แนวคิดของ "Information Marts" ปรากฏในระเบียบวิธี Data Vault 2.0 ซึ่งแทนที่แนวคิดเก่าของ "Data Mart" การเปลี่ยนแปลงนี้เกิดจากการตระหนักถึงภารกิจของการนำแบบจำลองข้อมูลไปใช้สำหรับการรายงานเป็นการแปลงข้อมูลเป็นสารสนเทศ ประการแรก โครงการ “Information Marts” ควรให้ข้อมูลที่เหมาะสมสำหรับธุรกิจในการตัดสินใจ

คำจำกัดความที่ค่อนข้างเป็นคำสะท้อนข้อเท็จจริงง่ายๆ สองประการ:

  1. ตู้โชว์ประเภท "Raw Data Marts" สร้างขึ้นจาก DATA VAULT แบบดิบ (RAW) ซึ่งเป็นที่เก็บที่มีเฉพาะแนวคิดพื้นฐาน: ฮับ ลิงค์ ดาวเทียม;
  2. ตู้โชว์ "Information Marts" สร้างขึ้นโดยใช้องค์ประกอบของ BUSINESS VAULT: PIT, BRIDGE

หากเราหันไปดูตัวอย่างการจัดเก็บข้อมูลเกี่ยวกับพนักงาน เราสามารถพูดได้ว่าหน้าร้านที่แสดงหมายเลขโทรศัพท์ปัจจุบัน (ปัจจุบัน) ของพนักงานนั้นเป็นหน้าร้านประเภท "Raw Data Marts" ในการสร้างตู้โชว์ดังกล่าว จะใช้รหัสธุรกิจของพนักงานและฟังก์ชัน MAX() ที่ใช้ในแอตทริบิวต์วันที่โหลดดาวเทียม (MAX(SatLoadDate)) เมื่อจำเป็นต้องเก็บประวัติการเปลี่ยนแปลงแอตทริบิวต์ในตู้โชว์ - มันถูกใช้งาน คุณต้องเข้าใจว่าโทรศัพท์เป็นรุ่นล่าสุดจากวันที่ใดถึงวันที่ใด การรวบรวมรหัสธุรกิจและวันที่โหลด ดาวเทียมจะเพิ่มคีย์หลักลงในตารางดังกล่าว และจะเพิ่มฟิลด์ของวันที่สิ้นสุดของระยะเวลาที่มีผลบังคับใช้ด้วย

การสร้างหน้าร้านที่เก็บข้อมูลล่าสุดสำหรับแต่ละแอตทริบิวต์ของดาวเทียมหลายดวงที่รวมอยู่ในฮับ เช่น หมายเลขโทรศัพท์ ที่อยู่ ชื่อเต็ม หมายถึงการใช้ตาราง PIT ซึ่งง่ายต่อการเข้าถึงวันที่ทั้งหมด ของความเกี่ยวข้อง ตู้โชว์ประเภทนี้เรียกว่า "Information Marts"

ทั้งสองวิธีเกี่ยวข้องกับทั้งการวัดและข้อเท็จจริง

หากต้องการสร้างหน้าร้านที่เก็บข้อมูลเกี่ยวกับลิงก์และฮับต่างๆ คุณสามารถใช้การเข้าถึงตาราง BRIDGE ได้

ด้วยบทความนี้ ฉันทำให้วงจรของแนวคิด DATA VAULT สมบูรณ์ ฉันหวังว่าข้อมูลที่ฉันแชร์จะเป็นประโยชน์ในการดำเนินโครงการของคุณ

โดยสรุปแล้วลิงก์ที่มีประโยชน์สองสามลิงก์เช่นเคย:

  • บทความ Kenta Graziano ซึ่งนอกเหนือจากคำอธิบายโดยละเอียดแล้ว ยังมีโมเดลไดอะแกรม

ที่มา: will.com

เพิ่มความคิดเห็น