DATA VAULT-ni ishlab chiqish va BIZNES DATA VAULT-ga o'tish

Oldingi maqolada men DATA VAULT asoslari haqida gapirgan edim, DATA VAULT ning asosiy elementlari va ularning maqsadini tasvirlab berdim. Buni DATA VAULT mavzusi tugagan deb hisoblash mumkin emas, DATA VAULT evolyutsiyasidagi keyingi qadamlar haqida gapirish kerak.

Va bu maqolada men DATA VAULT-ni rivojlantirish va BUSINESS DATA VAULT yoki oddiygina BUSINESS VAULT-ga o'tishga e'tibor qarataman.

BUSINESS DATA VAULT paydo bo'lishining sabablari

Shuni ta'kidlash kerakki, DATA VAULT ma'lum kuchli tomonlarga ega bo'lsa-da, kamchiliklardan xoli emas. Bu kamchiliklardan biri analitik so'rovlarni yozishdagi qiyinchilikdir. So'rovlarda juda ko'p JOINlar mavjud, kod uzoq va noqulay. Shuningdek, DATA VAULT-ga kiruvchi ma'lumotlar hech qanday o'zgarishlarga uchramaydi, shuning uchun biznes nuqtai nazaridan DATA VAULT sof shaklda mutlaq qiymatga ega emas.

Ushbu kamchiliklarni bartaraf etish uchun DATA VAULT metodologiyasi quyidagi elementlar bilan kengaytirildi:

  • PIT (vaqtdagi nuqta) jadvallari;
  • BRIDGE jadvallari;
  • OLDINDAN ANIQLANGAN TURILMALAR.

Keling, ushbu elementlarning maqsadini batafsil ko'rib chiqaylik.

PIT jadvallari

Odatda, bitta tadbirkorlik sub'ekti (HUB) turli xil yangilanish stavkalari bo'lgan ma'lumotlarni o'z ichiga olishi mumkin, masalan, agar biz shaxsni tavsiflovchi ma'lumotlar haqida gapiradigan bo'lsak, telefon raqami, manzili yoki elektron pochtasi haqidagi ma'lumotlarning yangilanish tezligi yuqoriroq ekanligini aytishimiz mumkin: to'liq ism, pasport ma'lumotlari, oilaviy ahvoli yoki jinsi.

Shuning uchun, sun'iy yo'ldoshlarni aniqlashda siz ularning yangilanish chastotasini yodda tutishingiz kerak. Nima uchun bu muhim?

Agar siz atributlarni bir xil jadvalda turli xil yangilanish stavkalari bilan saqlasangiz, eng tez-tez o'zgartiriladigan atribut har safar yangilanganda jadvalga qator qo'shishingiz kerak bo'ladi. Natijada disk maydonining ko'payishi va so'rovlarni bajarish vaqtining ko'payishi.

Endi biz sun'iy yo'ldoshlarni yangilanish chastotasi bo'yicha ajratdik va ularga mustaqil ravishda ma'lumotlarni yuklashimiz mumkin, biz eng so'nggi ma'lumotlarni olishimizga ishonch hosil qilishimiz kerak. Yaxshisi, keraksiz JOINlardan foydalanmasdan.

Menga tushuntirib beraman, masalan, siz turli xil yangilanish tezligiga ega bo'lgan sun'iy yo'ldoshlardan joriy (oxirgi yangilanish sanasi bo'yicha) ma'lumot olishingiz kerak. Buning uchun siz nafaqat JOINni amalga oshirishingiz, balki maksimal yangilanish sanasi MAX (Yangilanish sanasi) ni tanlagan holda bir nechta ichki so'rovlarni (ma'lumotni o'z ichiga olgan har bir sun'iy yo'ldosh uchun) yaratishingiz kerak bo'ladi. Har bir yangi JOIN bilan bunday kod o'sib boradi va tushunish juda qiyin bo'ladi.

PIT jadvali bunday so'rovlarni soddalashtirish uchun mo'ljallangan; PIT jadvallari DATA VAULT-ga yangi ma'lumotlarni yozish bilan bir vaqtda to'ldiriladi. PIT jadvali:

DATA VAULT-ni ishlab chiqish va BIZNES DATA VAULT-ga o'tish

Shunday qilib, biz har bir vaqtda barcha sun'iy yo'ldoshlar uchun ma'lumotlarning dolzarbligi haqida ma'lumotga egamiz. PIT jadvaliga JOIN-lardan foydalanib, biz PIT har kuni va bo'shliqlarsiz to'ldirilishi sharti bilan, ichki o'rnatilgan so'rovlarni butunlay yo'q qilishimiz mumkin. PITda bo'shliqlar mavjud bo'lsa ham, yangilangan ma'lumotlarni faqat PITning o'ziga bitta ichki so'rov yordamida olish mumkin. Bitta ichki so'rov har bir sun'iy yo'ldoshga o'rnatilgan so'rovlarga qaraganda tezroq ishlaydi.

BRIDGE

BRIDGE jadvallari analitik so'rovlarni soddalashtirish uchun ham qo'llaniladi. Biroq, PIT dan farq qiladigan narsa bu turli markazlar, havolalar va ularning sun'iy yo'ldoshlari o'rtasidagi so'rovlarni soddalashtirish va tezlashtirish vositasidir.

Jadvalda barcha sun'iy yo'ldoshlar uchun barcha kerakli kalitlar mavjud bo'lib, ular tez-tez so'rovlarda ishlatiladi. Bundan tashqari, agar kerak bo'lsa, xeshlangan biznes kalitlari, agar kalitlarning nomlari tahlil qilish uchun kerak bo'lsa, matn ko'rinishidagi kalitlar bilan to'ldirilishi mumkin.

Gap shundaki, BRIDGE-dan foydalanmasdan, turli xil hublarga tegishli sun'iy yo'ldoshlarda joylashgan ma'lumotlarni qabul qilish jarayonida nafaqat sun'iy yo'ldoshlarning o'zlari, balki hublarni bog'laydigan havolalarni ham JOIN qilish kerak bo'ladi.

BRIDGE ning mavjudligi yoki yo'qligi saqlash konfiguratsiyasi va so'rovlarni bajarish tezligini optimallashtirish zarurati bilan belgilanadi. BRIGEning universal misolini keltirish qiyin.

OLDINDAN ANIQLANGAN TURILMALAR

Bizni BIZNES MA'LUMOTLARI VAULTga yaqinlashtiradigan yana bir turdagi ob'ekt - bu oldindan hisoblangan ko'rsatkichlarni o'z ichiga olgan jadvallar. Bunday jadvallar biznes uchun juda muhim, ular berilgan qoidalarga muvofiq jamlangan ma'lumotlarni o'z ichiga oladi va ularga kirishni nisbatan osonlashtiradi.

Arxitektura nuqtai nazaridan, OLDINDAN TA'RILANGAN DERIVATIONS ma'lum bir markazning boshqa sun'iy yo'ldoshidan boshqa narsa emas. U oddiy sun'iy yo'ldosh kabi biznes kalitini va sun'iy yo'ldoshda yozuv yaratilgan sanani o'z ichiga oladi. Shunga qaramay, o'xshashliklar tugaydi. Bunday "ixtisoslashtirilgan" sun'iy yo'ldosh atributlarining keyingi tarkibi biznes foydalanuvchilari tomonidan eng mashhur, oldindan hisoblangan ko'rsatkichlar asosida aniqlanadi.

Masalan, xodim haqidagi ma'lumotlarni o'z ichiga olgan markaz quyidagi ko'rsatkichlarga ega sun'iy yo'ldoshni o'z ichiga olishi mumkin:

  • Eng kam ish haqi;
  • Maksimal ish haqi;
  • O'rtacha ish haqi;
  • Hisoblangan ish haqining yig'indisi va boshqalar.

Xuddi shu markazning PIT jadvaliga OLDINDAN TA'LQILGAN DERIVATIONS ni kiritish mantiqan to'g'ri, keyin siz maxsus tanlangan sanada xodim uchun ma'lumotlar bo'laklarini osongina olishingiz mumkin.

Natijalar

Amaliyot shuni ko'rsatadiki, DATA VAULT-dan biznes foydalanuvchilari tomonidan foydalanish bir necha sabablarga ko'ra biroz qiyin:

  • So'rov kodi murakkab va noqulay;
  • JOINlarning ko'pligi so'rovlar ishlashiga ta'sir qiladi;
  • Analitik so'rovlarni yozish uchun saqlash dizayni bo'yicha ajoyib bilim talab etiladi.

Ma'lumotlarga kirishni soddalashtirish uchun DATA VAULT qo'shimcha ob'ektlar bilan kengaytirilgan:

  • PIT (vaqtdagi nuqta) jadvallari;
  • BRIDGE jadvallari;
  • OLDINDAN ANIQLANGAN TURILMALAR.

Keyingisi maqola Men, menimcha, BI bilan ishlaydiganlar uchun eng qiziqarli narsani aytib berishni rejalashtirmoqdaman. Men DATA VAULT asosida faktlar jadvallari va o'lchov jadvallarini yaratish usullarini taqdim etaman.

Maqola materiallari quyidagilarga asoslanadi:

  • ning adabiyotlar Kent Graziano, unda batafsil tavsifga qo'shimcha ravishda modelning diagrammalari mavjud;
  • Kitob: β€œDATA VAULT 2.0 yordamida kengaytiriladigan ma’lumotlar omborini qurish”;
  • Maqola Ma'lumotlar ombori asoslari.

Manba: www.habr.com

a Izoh qo'shish