การพัฒนา DATA VAULT และการเปลี่ยนไปใช้ BUSINESS DATA VAULT

ในบทความก่อนหน้านี้ ฉันได้พูดคุยเกี่ยวกับพื้นฐานของ DATA VAULT ซึ่งอธิบายองค์ประกอบหลักของ DATA VAULT และวัตถุประสงค์ สิ่งนี้ไม่ถือเป็นหัวข้อของ DATA VAULT ที่หมดแรงแล้ว จำเป็นต้องพูดถึงขั้นตอนถัดไปในวิวัฒนาการของ DATA VAULT

และในบทความนี้ฉันจะมุ่งเน้นไปที่การพัฒนา DATA VAULT และการเปลี่ยนไปใช้ BUSINESS DATA VAULT หรือเพียงแค่ BUSINESS VAULT

เหตุผลในการปรากฏตัวของ BUSINESS DATA VAULT

ควรสังเกตว่า DATA VAULT แม้ว่าจะมีจุดแข็งบางอย่าง แต่ก็ไม่ได้ปราศจากข้อบกพร่อง ข้อเสียประการหนึ่งคือความยากในการเขียนแบบสอบถามเชิงวิเคราะห์ ข้อความค้นหามี JOIN จำนวนมาก โค้ดยาวและยุ่งยาก นอกจากนี้ ข้อมูลที่เข้าสู่ DATA VAULT ไม่ได้รับการเปลี่ยนแปลงใดๆ ดังนั้นจากมุมมองทางธุรกิจ DATA VAULT ในรูปแบบที่บริสุทธิ์จึงไม่มีคุณค่าที่แน่นอน

เป็นการขจัดข้อบกพร่องเหล่านี้ที่วิธีการ DATA VAULT ได้รับการขยายด้วยองค์ประกอบต่างๆ เช่น:

  • ตาราง PIT (ช่วงเวลา);
  • ตารางบริดจ์;
  • อนุพันธ์ที่กำหนดไว้ล่วงหน้า

มาดูจุดประสงค์ขององค์ประกอบเหล่านี้กันดีกว่า

ตาราง PIT

โดยทั่วไปแล้ว องค์กรธุรกิจ (HUB) อาจมีข้อมูลที่มีอัตราการอัปเดตที่แตกต่างกัน ตัวอย่างเช่น หากเรากำลังพูดถึงข้อมูลที่มีลักษณะเฉพาะของบุคคล เราสามารถพูดได้ว่าข้อมูลเกี่ยวกับหมายเลขโทรศัพท์ ที่อยู่ หรืออีเมลมีอัตราการอัปเดตที่สูงกว่าที่กล่าวไว้ ชื่อนามสกุล รายละเอียดหนังสือเดินทาง สถานภาพสมรส หรือเพศ

ดังนั้นเมื่อพิจารณาดาวเทียม คุณควรคำนึงถึงความถี่ในการอัปเดตด้วย ทำไมมันถึงสำคัญ?

หากคุณจัดเก็บแอตทริบิวต์ที่มีอัตราการอัปเดตต่างกันไว้ในตารางเดียวกัน คุณจะต้องเพิ่มแถวลงในตารางทุกครั้งที่มีการอัปเดตแอตทริบิวต์ที่เปลี่ยนแปลงบ่อยที่สุด ผลลัพธ์คือพื้นที่ดิสก์เพิ่มขึ้นและเวลาในการดำเนินการคิวรีเพิ่มขึ้น

ขณะนี้เราได้แบ่งดาวเทียมตามความถี่ในการอัปเดตและสามารถโหลดข้อมูลลงในดาวเทียมได้อย่างอิสระ เราควรตรวจสอบให้แน่ใจว่าเราสามารถรับข้อมูลล่าสุดได้ ดีกว่าโดยไม่ต้องใช้ JOIN ที่ไม่จำเป็น

ให้ฉันอธิบาย เช่น คุณต้องได้รับข้อมูลปัจจุบัน (ตามวันที่อัปเดตครั้งล่าสุด) จากดาวเทียมที่มีอัตราการอัปเดตต่างกัน ในการทำเช่นนี้ คุณไม่เพียงแต่จะต้องเข้าร่วมเท่านั้น แต่ยังต้องสร้างแบบสอบถามแบบซ้อนหลายรายการ (สำหรับดาวเทียมแต่ละดวงที่มีข้อมูล) ด้วยการเลือกวันที่อัปเดตสูงสุด MAX (วันที่อัปเดต) ด้วยการเข้าร่วมใหม่แต่ละครั้ง โค้ดดังกล่าวจะเติบโตขึ้นและเข้าใจได้ยากอย่างรวดเร็ว

ตาราง PIT ได้รับการออกแบบมาเพื่อทำให้การสืบค้นง่ายขึ้น ตาราง PIT จะถูกกรอกพร้อมกับการเขียนข้อมูลใหม่ไปยัง DATA VAULT ตารางพิท:

การพัฒนา DATA VAULT และการเปลี่ยนไปใช้ BUSINESS DATA VAULT

ดังนั้นเราจึงมีข้อมูลเกี่ยวกับความเกี่ยวข้องของข้อมูลของดาวเทียมทุกดวงในแต่ละช่วงเวลา การใช้ JOIN กับตาราง PIT ทำให้เราสามารถกำจัดคำค้นหาที่ซ้อนกันได้อย่างสมบูรณ์ โดยมีเงื่อนไขว่า PIT จะถูกเติมทุกวันและไม่มีช่องว่าง แม้ว่าจะมีช่องว่างใน PIT คุณสามารถรับข้อมูลล่าสุดได้โดยใช้แบบสอบถามแบบซ้อนเพียงรายการเดียวกับ PIT เอง การสืบค้นแบบซ้อนหนึ่งรายการจะประมวลผลได้เร็วกว่าการสืบค้นแบบซ้อนกับดาวเทียมแต่ละดวง

สะพาน

ตาราง BRIDGE ยังใช้เพื่อลดความซับซ้อนของแบบสอบถามเชิงวิเคราะห์อีกด้วย อย่างไรก็ตาม สิ่งที่แตกต่างจาก PIT คือวิธีการลดความซับซ้อนและเร่งคำขอระหว่างฮับ ลิงก์ และดาวเทียมต่างๆ

ตารางประกอบด้วยปุ่มที่จำเป็นทั้งหมดสำหรับดาวเทียมทุกดวง ซึ่งมักใช้ในการสืบค้น นอกจากนี้ หากจำเป็น คีย์ธุรกิจที่แฮชสามารถเสริมด้วยคีย์ในรูปแบบข้อความได้ หากจำเป็นต้องใช้ชื่อของคีย์เพื่อการวิเคราะห์

ความจริงก็คือโดยไม่ต้องใช้ BRIDGE ในกระบวนการรับข้อมูลที่อยู่ในดาวเทียมที่เป็นของฮับต่างๆ จะต้องทำการ JOIN ไม่เพียงแต่จากดาวเทียมเท่านั้น แต่ยังรวมไปถึงลิงก์ที่เชื่อมต่อฮับด้วย

การมีอยู่หรือไม่มี BRIDGE จะพิจารณาจากการกำหนดค่าพื้นที่เก็บข้อมูลและความจำเป็นในการปรับความเร็วการดำเนินการค้นหาให้เหมาะสม เป็นการยากที่จะสร้างตัวอย่างที่เป็นสากลของ BRIGE

อนุพันธ์ที่กำหนดไว้ล่วงหน้า

วัตถุอีกประเภทหนึ่งที่นำเราเข้าใกล้ BUSINESS DATA VAULT มากขึ้นคือตารางที่มีตัวบ่งชี้ที่คำนวณไว้ล่วงหน้า ตารางดังกล่าวมีความสำคัญมากสำหรับธุรกิจซึ่งมีข้อมูลที่รวบรวมตามกฎที่กำหนดและทำให้เข้าถึงได้ง่าย

ในเชิงสถาปัตยกรรม อนุพันธ์ที่กำหนดไว้ล่วงหน้านั้นไม่มีอะไรมากไปกว่าดาวเทียมดวงอื่นจากศูนย์กลางบางแห่ง เช่นเดียวกับดาวเทียมทั่วไป ประกอบด้วยรหัสธุรกิจและวันที่สร้างบันทึกในดาวเทียม นี่คือจุดสิ้นสุดของความคล้ายคลึงกัน องค์ประกอบเพิ่มเติมของคุณลักษณะของดาวเทียม "พิเศษ" ดังกล่าวถูกกำหนดโดยผู้ใช้ทางธุรกิจตามตัวบ่งชี้ที่คำนวณล่วงหน้าซึ่งได้รับความนิยมมากที่สุด

ตัวอย่างเช่น ศูนย์กลางที่มีข้อมูลเกี่ยวกับพนักงานอาจรวมถึงดาวเทียมที่มีตัวบ่งชี้เช่น:

  • ค่าแรงขั้นต่ำ;
  • เงินเดือนสูงสุด
  • เงินเดือนเฉลี่ย;
  • ยอดสะสมของค่าจ้างค้างรับ ฯลฯ

เป็นตรรกะที่จะรวม DERIVATIONS ที่กำหนดไว้ล่วงหน้าไว้ในตาราง PIT ของฮับเดียวกัน จากนั้นคุณจึงสามารถรับส่วนข้อมูลสำหรับพนักงานในวันที่เลือกโดยเฉพาะได้อย่างง่ายดาย

สรุป

ตามแนวทางปฏิบัติที่แสดงให้เห็น การใช้ DATA VAULT โดยผู้ใช้ทางธุรกิจค่อนข้างยากด้วยเหตุผลหลายประการ:

  • รหัสการสืบค้นมีความซับซ้อนและยุ่งยาก
  • การมี JOIN จำนวนมากส่งผลต่อประสิทธิภาพของแบบสอบถาม
  • การเขียนแบบสอบถามเชิงวิเคราะห์ต้องอาศัยความรู้ที่โดดเด่นเกี่ยวกับการออกแบบพื้นที่จัดเก็บข้อมูล

เพื่อให้การเข้าถึงข้อมูลง่ายขึ้น DATA VAULT จะถูกขยายด้วยออบเจ็กต์เพิ่มเติม:

  • ตาราง PIT (ช่วงเวลา);
  • ตารางบริดจ์;
  • อนุพันธ์ที่กำหนดไว้ล่วงหน้า

ต่อไป статье ในความคิดของฉัน ฉันวางแผนที่จะบอกสิ่งที่น่าสนใจที่สุดสำหรับผู้ที่ทำงานกับ BI ฉันจะนำเสนอวิธีสร้างตารางข้อเท็จจริงและตารางมิติตาม DATA VAULT

เนื้อหาของบทความมีพื้นฐานมาจาก:

ที่มา: will.com

เพิ่มความคิดเห็น