Data marts DATA VAULT

Oldingi maqolalar, biz DATA VAULT asoslari bilan tanishdik, DATA VAULTni tahlil qilish uchun qulayroq holatga kengaytirdik va BIZNES MA'LUMOTLARI VAULTni yaratdik. Seriyani uchinchi maqola bilan yakunlash vaqti keldi.

Oldingi xabarda e'lon qilganimdek adabiyotlar, ushbu maqola BI mavzusiga, aniqrog'i DATA VAULTni BI uchun ma'lumot manbai sifatida tayyorlashga bag'ishlanadi. Keling, faktlar va o'lchamlar jadvallarini qanday yaratishni ko'rib chiqaylik va shu bilan yulduz sxemasini yaratamiz.

DATA VAULT orqali ma'lumotlar marshrutlarini yaratish mavzusidagi ingliz tilidagi materiallarni o'rganishni boshlaganimda, jarayon juda murakkab ekanligini his qildim. Maqolalar ta'sirchan hajmga ega bo'lganligi sababli, Data Vault 2.0 metodologiyasida paydo bo'lgan matn tarkibidagi o'zgarishlarga havolalar mavjud va bu so'zlarning ahamiyati ko'rsatilgan.

Biroq, tarjimani o'rganib chiqib, bu jarayon unchalik murakkab emasligi ma'lum bo'ldi. Ammo, ehtimol, siz boshqacha fikrga ega bo'lasiz.

Shunday ekan, keling, mavzuga o‘tamiz.

DATA VAULT-dagi o'lchamlar va faktlar jadvallari

Tushunish uchun eng qiyin ma'lumotlar:

  • O'lchov jadvallari markazlar va ularning sun'iy yo'ldoshlaridan olingan ma'lumotlarga asoslanadi;
  • Fakt jadvallari havolalar va ularning sun'iy yo'ldoshlaridan olingan ma'lumotlarga asoslanadi.

Va bu haqda maqolani o'qib chiqqandan keyin aniq bo'ladi DATA VAULT asoslari. Hublar biznes ob'ektlarining noyob kalitlarini saqlaydi, ularning biznes ob'ektlari atributlari holatining sun'iy yo'ldoshlari vaqtga bog'langan, tranzaktsiyalarni qo'llab-quvvatlovchi havolalarga bog'langan sun'iy yo'ldoshlar ushbu operatsiyalarning raqamli xususiyatlarini saqlaydi.

Bu nazariya asosan tugaydi.

Ammo, shunga qaramay, mening fikrimcha, DATA VAULT metodologiyasi haqidagi maqolalarda paydo bo'lishi mumkin bo'lgan bir nechta tushunchalarni ta'kidlash kerak:

  • Raw Data Marts - "xom" ma'lumotlarning vitrini;
  • Information Marts - ma'lumotlar vitrinalari.

"Raw Data Marts" kontseptsiyasi juda oddiy JOINlarni amalga oshirish orqali DATA VAULT ma'lumotlari asosida qurilgan vitrinalarga ishora qiladi. "Raw Data Marts" yondashuvi tahlil qilish uchun mos bo'lgan ma'lumotlarga ega ombor loyihasini moslashuvchan va tez kengaytirish imkonini beradi. Ushbu yondashuv vitrinaga joylashtirishdan oldin murakkab ma'lumotlarni o'zgartirish va biznes qoidalarini bajarishni nazarda tutmaydi, ammo "Raw Data Marts" ma'lumotlari biznes foydalanuvchisi uchun tushunarli bo'lishi kerak va keyingi o'zgartirish uchun asos bo'lib xizmat qilishi kerak, masalan, BI vositalari bilan.

"Information Marts" tushunchasi Data Vault 2.0 metodologiyasida paydo bo'ldi, u eski "Data Marts" tushunchasini almashtirdi. Ushbu o'zgarish ma'lumotlarni ma'lumotga aylantirish sifatida hisobotlarni yaratish uchun ma'lumotlar modelini joriy etish vazifasini anglash bilan bog'liq. Information Marts sxemasi, birinchi navbatda, korxonalarni qaror qabul qilish uchun mos bo'lgan ma'lumotlar bilan ta'minlashi kerak.

Aniq ta'riflar ikkita oddiy faktni aks ettiradi:

  1. “Raw Data Marts” kabi vitrinalar xom (RAW) DATA VAULT asosida qurilgan bo‘lib, faqat asosiy tushunchalarni o‘z ichiga oladi: HUBS, LINKS, SATELLITES;
  2. “Information Marts” vitrinalari BUSINESS VAULT elementlari yordamida qurilgan: PIT, BRIDGE.

Agar xodim haqidagi ma'lumotlarni saqlash misollarini ko'rib chiqsak, shuni aytishimiz mumkinki, xodimning joriy (bugungi kun uchun amal qiladi) telefon raqamini ko'rsatadigan vitrin "Raw Data Marts" tipidagi vitridir. Bunday vitrinani yaratish uchun xodimning biznes kaliti va sun'iy yo'ldoshni yuklash sanasi atributida (MAX(SatLoadDate)) ishlatiladigan MAX() funksiyasidan foydalaniladi. Vitrinda atribut o'zgarishlari tarixini saqlash kerak bo'lganda - u ishlatiladi, siz telefon qaysi sanadan boshlab tegishli ekanligini tushunishingiz kerak, bunday jadvalning asosiy kaliti biznes kalitining kompilyatsiyasi va sanasi bo'ladi. sun'iy yo'ldoshga yuklang va tegishli davrning tugash sanasi maydoni ham qo'shiladi.

Hubga kiritilgan bir nechta sun'iy yo'ldoshlarning har bir atributi uchun joriy ma'lumotlarni, masalan, telefon raqami, manzili, to'liq nomini saqlaydigan do'konni yaratish PIT jadvalidan foydalanishni o'z ichiga oladi, unga kirish orqali barcha tegishli sanalarni olish oson. Ushbu turdagi ko'rgazmalar "Information Marts" deb nomlanadi.

Ikkala yondashuv ham o'lchovlar, ham faktlar uchun tegishli.

Bir nechta havolalar va markazlar haqida ma'lumot saqlaydigan vitrinalarni yaratish uchun BRIDGE jadvallariga kirishdan foydalanish mumkin.

Ushbu maqola bilan men DATA VAULT kontseptsiyasi bo'yicha seriyani yakunladim; Umid qilamanki, men baham ko'rgan ma'lumotlar loyihalaringizni amalga oshirishda foydali bo'ladi.

Har doimgidek, xulosa qilib, bir nechta foydali havolalar:

  • Maqola Kent Graziano, unda batafsil tavsifga qo'shimcha ravishda modelning diagrammalari mavjud;

Manba: www.habr.com

a Izoh qo'shish