Ngembangkeun DATA VAULT sareng transisi ka DATA VAULT USAHA

Dina artikel saméméhna, kuring ngobrol ngeunaan dasar-dasar DATA VAULT, ngajelaskeun unsur-unsur utama DATA VAULT sareng tujuanana. Ieu teu bisa dianggap topik DATA VAULT sakumaha exhausted; perlu ngobrol ngeunaan léngkah salajengna dina évolusi DATA VAULT.

Sarta dina artikel ieu kuring baris difokuskeun ngembangkeun DATA VAULT jeung transisi ka BUSINESS DATA VAULT atawa ngan saukur BUSINESS VAULT.

Alesan pikeun penampilan KOS DATA USAHA

Ieu kudu dicatet yén DATA VAULT, bari mibanda kaunggulan nu tangtu, teu tanpa drawbacks na. Salah sahiji kalemahan ieu nyaéta kasusah dina nulis patarosan analitik. Queries boga angka signifikan tina JOINs, kode nu panjang tur pajeujeut. Ogé, data anu ngasupkeun DATA VAULT henteu ngalaman transformasi naon waé, janten, tina sudut pandang bisnis, DATA VAULT dina bentuk murnina henteu gaduh nilai mutlak.

Pikeun ngaleungitkeun kakurangan ieu, metodologi DATA VAULT dilegaan ku elemen sapertos:

  • PIT (titik dina waktos) tabel;
  • tabél BRIDGE;
  • DERIVASI PREDEFINE.

Hayu urang nempo leuwih deukeut tujuan unsur ieu.

tabél PIT

Biasana, hiji éntitas bisnis (HUB) tiasa ngandung data kalayan tingkat pembaruan anu béda-béda, contona, upami urang nyarioskeun ngeunaan data ciri hiji jalma, urang tiasa nyarios yén inpormasi ngeunaan nomer telepon, alamat atanapi email ngagaduhan tingkat pembaruan anu langkung luhur tibatan anu nyarios, ngaran lengkep, rinci paspor, status kakawinan atawa gender.

Ku alatan éta, nalika nangtukeun satelit, Anjeun kudu tetep dina pikiran frékuénsi update maranéhanana. Naha éta penting?

Lamun anjeun nyimpen atribut kalawan ongkos update béda dina tabel sarua, anjeun bakal kudu nambahkeun hiji baris kana tabél unggal waktos atribut nu pangseringna robah diropéa. Hasilna nyaéta paningkatan dina rohangan disk sareng paningkatan waktos palaksanaan query.

Ayeuna urang geus ngabagi satelit ku frékuénsi update, sarta bisa ngamuat data kana aranjeunna sacara mandiri, urang kedah mastikeun yén urang tiasa nampi data up-to-date. Leuwih alus, tanpa ngagunakeun JOINs teu perlu.

Hayu atuh ngajelaskeun, contona, anjeun kudu ménta ayeuna (nurutkeun tanggal update panungtungan) informasi ti satelit nu boga ongkos update béda. Jang ngalampahkeun ieu, anjeun bakal kudu teu ukur nyieun hiji JOIN, tapi ogé pikeun nyieun sababaraha queries nested (pikeun unggal satelit ngandung émbaran) kalawan seleksi tanggal update maksimum MAX (Tanggal Update). Kalawan unggal JOIN anyar, kode sapertos tumuwuh sarta pohara gancang jadi hésé ngarti.

Tabel PIT dirancang pikeun nyederhanakeun patarosan sapertos kitu; tabél PIT dieusian sakaligus sareng nyerat data anyar kana DATA VAULT. tabel PIT:

Ngembangkeun DATA VAULT sareng transisi ka DATA VAULT USAHA

Ku kituna, urang boga informasi ngeunaan relevansi data pikeun sakabéh satelit dina unggal titik waktu. Ngagunakeun JOINs kana tabel PIT, urang sagemblengna bisa ngaleungitkeun queries nested, lumrah jeung kaayaan nu PIT dieusian unggal poé sarta tanpa sela. Sanaos aya jurang dina PIT, anjeun tiasa nampi data pangénggalna ngan ukur nganggo hiji pamundut nested kana PIT sorangan. Hiji query nested bakal ngolah leuwih gancang ti queries nested ka unggal satelit.

KIDUNG

tabél BRIDGE ogé dipaké pikeun simplify queries analitik. Sanajan kitu, naon béda ti PIT mangrupakeun sarana nyederhanakeun tur ngagancangkeun requests antara rupa hubs, Tumbu sarta satelit maranéhanana.

tabél ngandung sakabéh kenop diperlukeun pikeun sakabéh satelit, nu mindeng dipaké dina queries. Salaku tambahan, upami perlu, konci bisnis anu hashed tiasa ditambihan ku konci dina bentuk téks upami nami konci diperyogikeun pikeun analisa.

Kanyataan yén tanpa nganggo BRIDGE, dina prosés nampi data anu aya dina satelit milik hub anu béda-béda, éta bakal diperyogikeun pikeun ngahijikeun sanés ngan ukur satelit sorangan, tapi ogé tautan anu nyambungkeun hub.

Ayana atanapi henteuna BRIDGE ditangtukeun ku konfigurasi panyimpenan sareng kabutuhan pikeun ngaoptimalkeun laju palaksanaan query. Hese datang nepi ka conto universal BRIGE.

DERIVASI PREDEFINE

Jenis objék séjén anu ngadeukeutkeun urang ka VAULT DATA USAHA nyaéta tabel anu ngandung indikator anu tos diitung. Tabél sapertos kitu penting pisan pikeun bisnis; aranjeunna ngandung inpormasi anu dikelompokeun dumasar kana aturan anu dipasihkeun sareng ngajantenkeun gampang diakses.

Sacara arsitéktur, DERIVATION PREDEFINED henteu langkung ti satelit sanés tina hub anu tangtu. Éta, sapertos satelit biasa, ngandung konci bisnis sareng tanggal nyiptakeun catetan dina satelit. Ieu dimana kamiripan mungkas. Komposisi salajengna tina atribut satelit "spésialisasi" sapertos ditangtukeun ku pangguna bisnis dumasar kana indikator anu pang populerna, tos diitung.

Salaku conto, hub anu ngandung inpormasi ngeunaan karyawan tiasa kalebet satelit kalayan indikator sapertos:

  • Upah minimum;
  • Gaji maksimum;
  • Gaji rata-rata;
  • Total kumulatif gajih accrued, jsb.

Logis kalebet turunan PREDEFINED dina tabel PIT tina hub anu sami, teras anjeun tiasa kalayan gampang kéngingkeun potongan data pikeun karyawan dina tanggal anu dipilih sacara khusus.

KESIMPULAN

Salaku prakték nempokeun, pamakéan DATA VAULT ku pamaké bisnis rada hese kusabab sababaraha alesan:

  • Kodeu query rumit sareng pajeulit;
  • Kelimpahan JOINs mangaruhan kinerja queries;
  • Nulis queries analitik merlukeun pangaweruh beredar ngeunaan desain gudang.

Pikeun nyederhanakeun aksés data, DATA VAULT diperpanjang ku objék tambahan:

  • PIT (titik dina waktos) tabel;
  • tabél BRIDGE;
  • DERIVASI PREDEFINE.

Teras artikel Kuring rencanana ngabejaan, dina pamanggih kuring, hal paling metot pikeun maranéhanana anu gawé bareng BI. Kuring baris nampilkeun cara nyieun tabel kanyataan jeung tabel dimensi dumasar kana DATA VAULT.

Bahan artikel dumasar kana:

  • on publikasi Kenta Graziano, nu, sajaba katerangan lengkep, ngandung diagram model;
  • Buku: "Ngawangun Gudang Data Scalable kalawan DATA VAULT 2.0";
  • artikel Dasar Kolong Data.

sumber: www.habr.com

Tambahkeun komentar