Pangembangan DATA VAULT lan transisi menyang BUSINESS DATA VAULT

Ing artikel sadurunge, aku ngomong babagan dhasar DATA VAULT, nggambarake unsur utama DATA VAULT lan tujuane. Iki ora bisa dianggep topik DATA VAULT minangka kesel; perlu kanggo ngomong babagan langkah sabanjure ing evolusi DATA VAULT.

Lan ing artikel iki aku bakal fokus ing pangembangan DATA VAULT lan transisi menyang BUSINESS DATA VAULT utawa mung BUSINESS VAULT.

Alasan munculé VAULT DATA BISNIS

Sampeyan kudu nyatet sing DATA VAULT, nalika duwe kekuatan tartamtu, ora tanpa drawbacks. Salah sawijining kekurangan yaiku angel nulis pitakon analitis. Pitakonan duwe jumlah sing signifikan saka JOIN, kode kasebut dawa lan rumit. Uga, data sing ngetik DATA VAULT ora ngalami owah-owahan, mula saka sudut pandang bisnis, DATA VAULT ing wangun murni ora duwe nilai mutlak.

Kanggo ngilangi kekurangan kasebut, metodologi DATA VAULT ditambahi karo unsur kayata:

  • Tabel PIT (titik ing wektu);
  • tabel BRIDGE;
  • DERIVASI PREDEFINE.

Ayo dideleng kanthi luwih rinci babagan tujuan unsur kasebut.

tabel PIT

Biasane, siji entitas bisnis (HUB) bisa ngemot data kanthi tingkat nganyari sing beda-beda, contone, yen kita ngomong babagan data sing dadi ciri wong, kita bisa ngomong yen informasi babagan nomer telpon, alamat utawa email nduweni tingkat nganyari sing luwih dhuwur tinimbang ngomong, jeneng lengkap, rincian passport, status perkawinan utawa gender.

Mulane, nalika nemtokake satelit, sampeyan kudu ngelingi frekuensi nganyari. Apa sebabe penting?

Yen sampeyan nyimpen atribut kanthi tingkat nganyari sing beda-beda ing tabel sing padha, sampeyan kudu nambahake baris ing tabel saben-saben atribut sing paling kerep diganti dianyari. Asilé yaiku tambah spasi disk lan tambah wektu eksekusi query.

Saiki kita wis dibagi satelit miturut frekuensi nganyari, lan bisa mbukak data menyang wong independen, kita kudu mesthekake yen kita bisa nampa data anyar. Luwih apik, tanpa nggunakake JOIN sing ora perlu.

Ayo kula nerangake, contone, sampeyan kudu entuk informasi saiki (miturut tanggal nganyari pungkasan) saka satelit sing duwe tarif nganyari beda. Kanggo nindakake iki, sampeyan kudu ora mung kanggo nggawe JOIN, nanging uga kanggo nggawe sawetara nested pitakon (kanggo saben satelit ngemot informasi) karo pilihan saka maksimum nganyari tanggal MAX (Update Tanggal). Kanthi saben JOIN anyar, kode kasebut tuwuh lan cepet banget angel dingerteni.

Tabel PIT dirancang kanggo nyederhanakake pitakon kasebut; Tabel PIT diisi bebarengan karo nulis data anyar menyang DATA VAULT. Tabel PIT:

Pangembangan DATA VAULT lan transisi menyang BUSINESS DATA VAULT

Mangkono, kita duwe informasi babagan relevansi data kanggo kabeh satelit ing saben wektu. Nggunakake JOINs menyang tabel PIT, kita bisa ngilangi pitakon nested kanthi lengkap, kanthi syarat PIT diisi saben dina lan tanpa kesenjangan. Sanajan ana kesenjangan ing PIT, sampeyan bisa entuk data paling anyar mung nggunakake query nested menyang PIT dhewe. Siji query nested bakal diproses luwih cepet tinimbang query nested kanggo saben satelit.

KANGGO

Tabel BRIDGE uga digunakake kanggo nyederhanakake pitakon analitis. Nanging, sing beda karo PIT yaiku cara nyederhanakake lan nyepetake panjaluk antarane macem-macem hub, tautan lan satelite.

Tabel kasebut ngemot kabeh tombol sing dibutuhake kanggo kabeh satelit, sing asring digunakake ing pitakon. Kajaba iku, yen perlu, kunci bisnis hash bisa ditambah karo tombol ing wangun teks yen jeneng tombol dibutuhake kanggo analisis.

Kasunyatane yaiku tanpa nggunakake BRIDGE, ing proses nampa data sing ana ing satelit sing ana ing hub sing beda-beda, sampeyan kudu nggawe JOIN ora mung saka satelit dhewe, nanging uga link sing nyambungake hub.

Ana utawa ora ana BRIDGE ditemtokake dening konfigurasi panyimpenan lan perlu kanggo ngoptimalake kacepetan eksekusi query. Iku angel teka munggah karo conto universal saka BRIGE.

DERIVASI PREDEFINE

Jinis obyek liyane sing ndadekke kita nyedhaki VAULT DATA BISNIS yaiku tabel sing ngemot indikator sing wis diwilang. Tabel kasebut pancen penting kanggo bisnis; ngemot informasi sing dikumpulake miturut aturan sing diwenehake lan gampang diakses.

Sacara arsitektur, PREDEFINED DERIVATIONS ora luwih saka satelit liyane saka hub tartamtu. Iku, kaya satelit biasa, ngemot kunci bisnis lan tanggal nggawe rekaman ing satelit. Iki ngendi podho mungkasi, Nanging. Komposisi luwih saka atribut satelit "khusus" kasebut ditemtokake dening pangguna bisnis adhedhasar indikator sing paling populer lan wis diwilang.

Contone, hub sing ngemot informasi babagan karyawan bisa uga kalebu satelit kanthi indikator kayata:

  • Upah minimal;
  • Gaji maksimum;
  • Gaji rata-rata;
  • Total kumulatif saka upah sing ditampa, lsp.

Iku logis kanggo kalebu DERIVATIONS PREDEFINED ing tabel PIT saka hub padha, banjur sampeyan bisa kanthi gampang njupuk irisan data kanggo pegawe ing tanggal sing dipilih khusus.

KESIMPULAN

Minangka praktik nuduhake, panggunaan DATA VAULT dening pangguna bisnis rada angel amarga sawetara alasan:

  • Kode pitakon rumit lan rumit;
  • Kelimpahan JOIN mengaruhi kinerja pitakon;
  • Nulis pitakon analitis mbutuhake kawruh sing luar biasa babagan desain panyimpenan.

Kanggo nyederhanakake akses data, DATA VAULT ditambahi karo obyek tambahan:

  • Tabel PIT (titik ing wektu);
  • tabel BRIDGE;
  • DERIVASI PREDEFINE.

Sabanjure artikel Aku rencana kanggo ngomong, ing mratelakake panemume, bab sing paling menarik kanggo wong-wong sing makarya karo BI. Aku bakal menehi cara kanggo nggawe tabel fakta lan tabel dimensi adhedhasar DATA VAULT.

Materi artikel adhedhasar:

  • Ing publikasi Kenta Graziano, sing, saliyane kanggo katrangan rinci, ngemot diagram model;
  • Buku: "Mbangun Gudang Data Scalable karo DATA VAULT 2.0";
  • Artikel Dhasar Data Vault.

Source: www.habr.com

Add a comment