Data marts DATA VAULT

Dalam sebelumnya artikel, kami telah melihat asas-asas DATA VAULT, memanjangkan DATA VAULT kepada keadaan yang lebih boleh dihuraikan dan mencipta BUSINESS DATA VULT. Sudah tiba masanya untuk menamatkan siri dengan artikel ketiga.

Seperti yang saya umumkan sebelum ini penerbitan, artikel ini akan memfokuskan kepada topik BI, atau lebih tepat lagi penyediaan DATA VAULT sebagai sumber data untuk BI. Mari lihat cara mencipta jadual fakta dan dimensi dan seterusnya mencipta skema bintang.

Apabila saya mula mempelajari bahan bahasa Inggeris mengenai topik mencipta data mart melalui DATA VAULT, saya merasakan bahawa prosesnya agak rumit. Memandangkan artikel mempunyai panjang yang mengagumkan, terdapat rujukan kepada perubahan dalam kata-kata yang muncul dalam metodologi Data Vault 2.0, kepentingan kata-kata ini ditunjukkan.

Walau bagaimanapun, setelah menyelidiki terjemahan, menjadi jelas bahawa proses ini tidak begitu rumit. Tetapi anda mungkin mempunyai pendapat yang berbeza.

Jadi, mari kita ke intinya.

Jadual dimensi dan fakta dalam DATA VAULT

Maklumat yang paling sukar untuk difahami:

  • Jadual ukuran dibina berdasarkan maklumat daripada hab dan satelitnya;
  • Jadual fakta dibina berdasarkan maklumat daripada pautan dan satelitnya.

Dan ini jelas selepas membaca artikel tentang asas VAULT DATA. Hab menyimpan kunci unik objek perniagaan, satelit terikat masa bagi keadaan atribut objek perniagaan, satelit yang terikat pada pautan yang menyokong transaksi menyimpan ciri berangka transaksi ini.

Di sinilah teori pada dasarnya berakhir.

Tetapi, bagaimanapun, pada pendapat saya, perlu diperhatikan beberapa konsep yang boleh didapati dalam artikel mengenai metodologi DATA VAULT:

  • Raw Data Mart - mempamerkan data "mentah";
  • Information Mart - pameran maklumat.

Konsep "Raw Data Mart" - menandakan mart dibina di atas data VAULT DATA dengan melakukan JOIN yang agak mudah. Pendekatan "Raw Data Marts" membolehkan anda mengembangkan projek gudang secara fleksibel dan cepat dengan maklumat yang sesuai untuk analisis. Pendekatan ini tidak melibatkan melakukan transformasi data yang kompleks dan melaksanakan peraturan perniagaan sebelum diletakkan di etalase, walau bagaimanapun, data Raw Data Marts harus difahami oleh pengguna perniagaan dan harus menjadi asas untuk transformasi selanjutnya, contohnya, oleh alat BI .

Konsep "Information Marts" muncul dalam metodologi Data Vault 2.0, ia menggantikan konsep lama "Data Marts". Perubahan ini adalah kerana merealisasikan tugas melaksanakan model data untuk pelaporan sebagai transformasi data kepada maklumat. Skim "Maklumat Maklumat", pertama sekali, harus menyediakan perniagaan dengan maklumat yang sesuai untuk membuat keputusan.

Takrifan yang agak bertele-tele mencerminkan dua fakta mudah:

  1. Pameran jenis "Raw Data Marts" dibina pada VAULT DATA mentah (RAW), repositori yang mengandungi hanya konsep asas: HUBS, LINKS, SATELIT;
  2. Pameran "Information Marts" dibina menggunakan elemen BUSINESS VAULT: PIT, BRIDGE.

Jika kita beralih kepada contoh menyimpan maklumat tentang pekerja, kita boleh mengatakan bahawa etalase yang memaparkan nombor telefon semasa (semasa) pekerja ialah etalase jenis "Raw Data Marts". Untuk membentuk pameran sedemikian, kunci perniagaan pekerja dan fungsi MAX() yang digunakan pada atribut tarikh pemuatan satelit (MAX(SatLoadDate)) digunakan. Apabila diperlukan untuk menyimpan sejarah perubahan atribut dalam pameran - ia digunakan, anda perlu memahami dari tarikh berapa hingga tarikh telefon dikemas kini, kompilasi kunci perniagaan dan tarikh pemuatan ke satelit akan menambah kunci utama pada jadual sedemikian, medan tarikh tamat tempoh sah juga ditambah.

Mencipta etalase yang menyimpan maklumat terkini untuk setiap atribut beberapa satelit yang disertakan dalam hab, contohnya, nombor telefon, alamat, nama penuh, membayangkan penggunaan jadual PIT, yang melaluinya mudah untuk mengakses semua tarikh perkaitan. Pameran jenis ini dirujuk sebagai "Maklumat Maklumat".

Kedua-dua pendekatan adalah relevan untuk kedua-dua ukuran dan fakta.

Untuk membuat etalase yang menyimpan maklumat tentang beberapa pautan dan hab, akses kepada jadual BRIDGE boleh digunakan.

Dengan artikel ini, saya melengkapkan kitaran mengenai konsep DATA VAULT, saya berharap maklumat yang saya kongsikan akan berguna dalam pelaksanaan projek anda.

Seperti biasa, sebagai kesimpulan, beberapa pautan berguna:

  • Perkara Kenta Graziano, yang, sebagai tambahan kepada penerangan terperinci, mengandungi gambar rajah model;

Sumber: www.habr.com

Tambah komen