DATA VAULT-un inkişafı və BUSINES DATA VAULT-a keçid

Əvvəlki məqalədə mən DATA VAULT-un əsasları haqqında danışdım, DATA VAULT-un əsas elementlərini və onların təyinatını təsvir etdim. Bu məqamda DATA VAULT mövzusunu tükənmiş hesab etmək olmaz, DATA VAULT-un təkamülündə növbəti addımlardan danışmaq lazımdır.

Və bu yazıda mən DATA VAULT-un inkişafı və BUSINESS DATA VAULT və ya sadəcə BUSINESS VAULT-a keçid üzərində dayanacağam.

BUSINESS DATA VAULT-un yaranmasının səbəbləri

Qeyd etmək lazımdır ki, müəyyən güclü tərəflərə malik olan DATA VAULT çatışmazlıqlardan da xali deyil. Bu çatışmazlıqlardan biri analitik sorğuların yazılmasının çətinliyidir. Sorğularda əhəmiyyətli sayda JOIN var, kod uzun və çətin olur. Həmçinin, DATA VAULT-a daxil olan məlumatlar heç bir transformasiyaya məruz qalmır, buna görə də biznes nöqteyi-nəzərindən DATA VAULT-un təmiz formada heç bir şərtsiz dəyəri yoxdur.

Bu çatışmazlıqları aradan qaldırmaq üçün DATA VAULT metodologiyası aşağıdakı elementlərlə genişləndirildi:

  • PIT (zaman nöqtəsi) cədvəlləri;
  • BRIDGE masaları;
  • ƏVVƏLDƏN MÜƏYYƏN EDİLMİŞ TƏRƏMƏLƏR.

Bu elementlərin məqsədini daha ətraflı nəzərdən keçirək.

PIT masaları

Bir qayda olaraq, bir iş obyekti (HUB) müxtəlif yeniləmə dərəcələri olan məlumatları ehtiva edə bilər, məsələn, bir insanı xarakterizə edən məlumatlardan danışırıqsa, telefon nömrəsi, ünvan və ya e-poçt haqqında məlumatın yenilənmə sürətindən daha yüksək olduğunu söyləyə bilərik. tam adı, pasport məlumatları, ailə vəziyyəti və ya cinsi.

Buna görə də peykləri təyin edərkən onların yenilənmə tezliyini nəzərə almaq lazımdır. Niyə vacibdir?

Eyni cədvəldə fərqli yeniləmə dərəcələri ilə atributları saxlayırsınızsa, ən tez-tez dəyişdirilən atribut hər dəfə yeniləndikdə cədvələ bir sıra əlavə etməli olacaqsınız. Nəticədə disk sahəsinin həcminin artması, sorğuların icra müddətinin artması müşahidə olunur.

İndi biz peykləri yeniləmə sürətinə görə ayırmışıq və biz müstəqil olaraq onlara məlumat yükləyə bildiyimiz üçün, ən son məlumatları əldə edə bildiyimizi təmin etməliyik. Lazımsız JOIN-lərdən istifadə etmədən daha yaxşıdır.

İcazə verin izah edim, məsələn, müxtəlif yeniləmə dərəcələri olan peyklərdən ən son (son yeniləmə tarixinə görə) məlumat almalısınız. Bunu etmək üçün sizə yalnız QOŞULMAQ deyil, həm də maksimum yeniləmə tarixi MAX (Yeniləmə tarixi) seçimi ilə bir neçə iç-içə sorğu (məlumat ehtiva edən hər bir peyk üçün) yaratmalısınız. Hər yeni JOIN ilə belə kod böyüyür və çox tez başa düşmək çətinləşir.

PIT cədvəli bu cür sorğuları sadələşdirmək üçün nəzərdə tutulmuşdur, PIT cədvəlləri DATA VAULT-a yeni məlumatlar yazılmaqla eyni vaxtda doldurulur. PIT cədvəli:

DATA VAULT-un inkişafı və BUSINES DATA VAULT-a keçid

Beləliklə, hər bir zaman nöqtəsində bütün peyklər üçün məlumatların aktuallığı haqqında məlumatımız var. PIT cədvəlindəki JOIN-lərdən istifadə edərək, biz iç içə sorğuları tamamilə aradan qaldıra bilərik, əlbəttə ki, PIT-in hər gün doldurulması və boşluqlar olmadan. PIT-də boşluqlar olsa belə, siz yalnız PIT-in özünə bir iç içə sorğudan istifadə edərək ən son məlumatları əldə edə bilərsiniz. Bir iç içə sorğu hər bir peyk üçün daxili sorğulardan daha sürətli işləyəcək.

BRIDGE

BRIDGE cədvəlləri analitik sorğuları sadələşdirmək üçün də istifadə olunur. Bununla belə, PIT-dən fərq müxtəlif hublar, keçidlər və onların peykləri arasında sorğuların sadələşdirilməsi və sürətləndirilməsi vasitəsidir.

Cədvəl sorğularda tez-tez istifadə olunan bütün peyklər üçün lazım olan bütün açarları ehtiva edir. Bundan əlavə, zəruri hallarda, təhlil üçün açarların adlarına ehtiyac olduqda, hashed biznes açarları mətn şəklində açarlarla əlavə edilə bilər.

Məsələ burasındadır ki, BRIDGE-dən istifadə etmədən müxtəlif mərkəzlərə aid olan peyklərdə yerləşən məlumatların əldə edilməsi prosesində təkcə peyklərin özlərinə deyil, həm də hubları birləşdirən keçidlərə QOŞULMAQ lazım gələcək.

BRIDGE-nin mövcudluğu və ya olmaması yaddaş konfiqurasiyası, sorğunun icra sürətinin optimallaşdırılması ehtiyacı ilə müəyyən edilir. BRIGE-nin universal nümunəsi ilə çıxış etmək çətindir.

ƏVVƏLDƏN MÜƏYYƏN EDİLMİŞ TƏRƏMƏLƏR

Bizi BUSINESS DATA VAULT-a yaxınlaşdıran başqa bir obyekt növü əvvəlcədən hesablanmış göstəriciləri ehtiva edən cədvəllərdir. Belə cədvəllər biznes üçün həqiqətən vacibdir, onlar verilmiş qaydalara uyğun toplanmış məlumatları ehtiva edir və onlara daxil olmağı nisbətən asanlaşdırır.

Arxitektura baxımından, ÖNCƏDƏN TƏYİN EDİLMİŞ TƏRƏMƏLƏR müəyyən bir mərkəzin başqa bir peykindən başqa bir şey deyil. O, adi peyk kimi, biznes açarını və peykdə qeydin yaradılma tarixini ehtiva edir. Ancaq oxşarlıqların bitdiyi yer budur. Belə bir "ixtisaslaşdırılmış" peykin atributlarının sonrakı tərkibi biznes istifadəçiləri tərəfindən ən populyar, əvvəlcədən hesablanmış göstəricilər əsasında müəyyən edilir.

Məsələn, işçi haqqında məlumatı ehtiva edən mərkəzə aşağıdakı kimi göstəriciləri olan bir peyk daxil ola bilər:

  • Minimum əmək haqqı;
  • Maksimum əmək haqqı;
  • Orta əmək haqqı;
  • Hesablanmış əmək haqqının məcmu cəmi və s.

ƏVVƏLDƏN MÜƏYYƏN EDİLMİŞ TƏRƏMƏLƏRİ eyni mərkəzin PIT cədvəlinə daxil etmək məntiqlidir, onda siz asanlıqla müəyyən bir tarix üçün işçi məlumat dilimlərini əldə edə bilərsiniz.

SONUÇLAR

Təcrübə göstərir ki, DATA VAULT-un biznes istifadəçiləri tərəfindən istifadəsi bir neçə səbəbə görə bir qədər çətindir:

  • Sorğu kodu mürəkkəb və çətin olur;
  • JOIN-lərin çoxluğu sorğunun performansına təsir edir;
  • Analitik sorğuların yazılması anbar strukturu haqqında mükəmməl bilik tələb edir.

Məlumata girişi asanlaşdırmaq üçün DATA VAULT əlavə obyektlərlə genişləndirilir:

  • PIT (zaman nöqtəsi) cədvəlləri;
  • BRIDGE masaları;
  • ƏVVƏLDƏN MÜƏYYƏN EDİLMİŞ TƏRƏMƏLƏR.

Sonrakı məqalə Fikrimcə, BI ilə işləyənlər üçün ən maraqlısını söyləməyi planlaşdırıram. DATA VAULT əsasında cədvəllər - faktlar və cədvəllər - ölçülər yaratmağın yollarını təqdim edəcəyəm.

Məqalənin materialları aşağıdakılara əsaslanır:

  • Haqqında Nəşr Kenta Graziano, ətraflı təsvirə əlavə olaraq, model diaqramlarını ehtiva edir;
  • Kitab: "DATA VAULT 2.0 ilə Ölçülənə bilən Məlumat Anbarının qurulması";
  • Maddə Data Vault Əsasları.

Mənbə: www.habr.com

Добавить комментарий