خزنة البيانات

في السابق مقالات، لقد رأينا أساسيات DATA VAULT ، وتمديد DATA VAULT إلى حالة أكثر قابلية للتحليل ، وإنشاء مخزن بيانات BUSINESS DATA VAULT. حان الوقت لإنهاء المسلسل بالمقال الثالث.

كما أعلنت في السابق منشور، ستركز هذه المقالة على موضوع BI ، أو بالأحرى إعداد DATA VAULT كمصدر بيانات لـ BI. لنلقِ نظرة على كيفية إنشاء جداول البيانات الفعلية والأبعاد ومن ثم إنشاء مخطط نجمي.

عندما بدأت في دراسة مواد باللغة الإنجليزية حول موضوع إنشاء مجموعات بيانات عبر DATA VAULT ، كان لدي شعور بأن العملية معقدة نوعًا ما. نظرًا لأن المقالات طويلة جدًا ، فهناك إشارات إلى التغييرات في الصياغة التي ظهرت في منهجية Data Vault 2.0 ، فقد تم توضيح أهمية هذه الصياغات.

ومع ذلك ، بعد الخوض في الترجمة ، أصبح من الواضح أن هذه العملية ليست معقدة للغاية. لكن قد يكون لديك رأي مختلف.

وهكذا ، دعنا نصل إلى هذه النقطة.

جداول الأبعاد والحقائق في DATA VAULT

أصعب المعلومات في الفهم:

  • جداول القياس مبنية على معلومات من المحاور وأقمارها الصناعية ؛
  • جداول الحقائق مبنية على معلومات من الروابط وأقمارها الصناعية.

وهذا واضح بعد قراءة المقال حول أساسيات حجرة البيانات. تخزن المحاور مفاتيح فريدة لكائنات الأعمال ، وأقمارها الصناعية المحددة زمنياً لسمات كائن الأعمال ، والأقمار الصناعية المرتبطة بالروابط الداعمة للمعاملات تخزن الخصائص العددية لهذه المعاملات.

هذا هو المكان الذي تنتهي فيه النظرية بشكل أساسي.

ولكن ، مع ذلك ، في رأيي ، من الضروري ملاحظة بعض المفاهيم التي يمكن العثور عليها في مقالات حول منهجية DATA VAULT:

  • Raw Data Marts - عرض بيانات "خام" ؛
  • معلومات مارت - معارض المعلومات.

مفهوم "Raw Data Marts" - يشير إلى المتاجر المبنية على بيانات DATA VAULT عن طريق إجراء عمليات JOINs بسيطة إلى حد ما. يتيح لك نهج "Raw Data Marts" توسيع مشروع المستودع بشكل مرن وسريع بمعلومات مناسبة للتحليل. لا يتضمن هذا النهج إجراء تحويلات معقدة للبيانات وتنفيذ قواعد العمل قبل وضعها في واجهة المتجر ، ومع ذلك ، يجب أن تكون بيانات Raw Data Marts مفهومة لمستخدم الأعمال ويجب أن تكون بمثابة أساس لمزيد من التحول ، على سبيل المثال ، بواسطة أدوات ذكاء الأعمال .

ظهر مفهوم "Information Marts" في منهجية Data Vault 2.0 ، حيث حل محل المفهوم القديم لـ "Data Marts". يرجع هذا التغيير إلى تحقيق مهمة تنفيذ نموذج البيانات للإبلاغ كتحويل البيانات إلى معلومات. أولاً وقبل كل شيء ، يجب أن يزود مخطط "سوق المعلومات" الشركة بالمعلومات المناسبة لاتخاذ القرار.

تعكس التعريفات المصممة بالأحرى حقيقتين بسيطتين:

  1. يتم إنشاء واجهات العرض من نوع "Raw Data Marts" على مخزن بيانات خام (RAW) ، وهو مستودع يحتوي على المفاهيم الأساسية فقط: HUBS و LINKS و SATELLITES ؛
  2. تم تصميم واجهات "Information Marts" باستخدام عناصر BUSINESS VAULT: PIT، BRIDGE.

إذا لجأنا إلى أمثلة لتخزين المعلومات حول أحد الموظفين ، فيمكننا القول إن واجهة المتجر التي تعرض رقم الهاتف (الحالي) للموظف هي واجهة متجر من نوع "Raw Data Marts". لتشكيل مثل هذا العرض ، يتم استخدام مفتاح عمل الموظف ووظيفة MAX () المستخدمة في سمة تاريخ تحميل القمر الصناعي (MAX (SatLoadDate)). عندما يكون مطلوبًا تخزين محفوظات تغييرات السمات في واجهة العرض - يتم استخدامها ، فأنت بحاجة إلى فهم التاريخ الذي تم فيه تحديث الهاتف ، وتجميع مفتاح العمل وتاريخ التحميل إلى القمر الصناعي سيضيف المفتاح الأساسي إلى هذا الجدول ، ويضاف أيضًا حقل تاريخ انتهاء فترة الصلاحية.

إنشاء واجهة متجر تخزن معلومات محدثة لكل سمة من عدة أقمار صناعية مدرجة في المحور ، على سبيل المثال ، رقم الهاتف والعنوان والاسم الكامل ، يعني استخدام جدول PIT ، والذي من خلاله يسهل الوصول إلى جميع التواريخ ذات صلة. يشار إلى العروض من هذا النوع باسم "أسواق المعلومات".

كلا النهجين مناسبين لكل من القياسات والحقائق.

لإنشاء واجهات المتاجر التي تخزن معلومات حول العديد من الارتباطات والمحاور ، يمكن استخدام الوصول إلى جداول BRIDGE.

مع هذه المقالة ، أكمل السلسلة حول مفهوم DATA VAULT ، وآمل أن تكون المعلومات التي شاركتها مفيدة في تنفيذ مشاريعك.

كما هو الحال دائمًا ، في الختام ، هناك بعض الروابط المفيدة:

  • مقالة Kenta Graziano ، الذي يحتوي ، بالإضافة إلى الوصف التفصيلي ، على مخططات نموذجية ؛

المصدر: www.habr.com

إضافة تعليق