Data mart DATA VAULT

Di sebelumnya artikel, kita telah melihat dasar-dasar DATA VAULT, memperluas DATA VAULT ke status yang lebih dapat diuraikan, dan membuat BISNIS DATA VAULT. Saatnya mengakhiri seri dengan artikel ketiga.

Seperti yang saya umumkan sebelumnya Publikasi, artikel ini akan fokus pada topik BI, atau lebih tepatnya persiapan DATA VAULT sebagai sumber data untuk BI. Mari kita lihat cara membuat tabel fakta dan dimensi dan dengan demikian membuat skema bintang.

Ketika saya mulai mempelajari materi berbahasa Inggris tentang topik membuat data mart melalui DATA VAULT, saya merasa prosesnya agak rumit. Karena artikel cukup panjang, ada referensi untuk perubahan kata-kata yang muncul dalam metodologi Data Vault 2.0, pentingnya kata-kata ini ditunjukkan.

Namun, setelah mempelajari terjemahannya, menjadi jelas bahwa proses ini tidak terlalu rumit. Tetapi Anda mungkin memiliki pendapat yang berbeda.

Jadi, mari kita langsung ke intinya.

Tabel dimensi dan fakta di DATA VAULT

Informasi yang paling sulit untuk dipahami:

  • Tabel pengukuran dibuat berdasarkan informasi dari hub dan satelitnya;
  • Tabel fakta dibangun berdasarkan informasi dari tautan dan satelitnya.

Dan ini terlihat jelas setelah membaca artikel tentang Dasar-dasar VAULT DATA. Hub menyimpan kunci unik dari objek bisnis, satelit terikat waktu dari status atribut objek bisnis, satelit yang diikat ke tautan yang mendukung transaksi menyimpan karakteristik numerik dari transaksi ini.

Di sinilah teori pada dasarnya berakhir.

Namun, bagaimanapun, menurut saya, perlu diperhatikan beberapa konsep yang dapat ditemukan di artikel tentang metodologi DATA VAULT:

  • Raw Data Mart - menampilkan data "mentah";
  • Information Marts - pameran informasi.

Konsep "Raw Data Marts" - menunjukkan mart yang dibangun di atas data DATA VAULT dengan melakukan GABUNG yang cukup sederhana. Pendekatan "Raw Data Marts" memungkinkan Anda memperluas proyek gudang secara fleksibel dan cepat dengan informasi yang sesuai untuk analisis. Pendekatan ini tidak melibatkan melakukan transformasi data yang kompleks dan menjalankan aturan bisnis sebelum ditempatkan di etalase, namun, data Raw Data Mart harus dapat dipahami oleh pengguna bisnis dan harus berfungsi sebagai dasar untuk transformasi lebih lanjut, misalnya dengan alat BI. .

Konsep "Information Marts" muncul dalam metodologi Data Vault 2.0, menggantikan konsep lama "Data Marts". Perubahan ini dikarenakan realisasi tugas penerapan model data untuk pelaporan sebagai transformasi data menjadi informasi. Skema "Information Marts", pertama-tama, harus menyediakan bisnis dengan informasi yang sesuai untuk pengambilan keputusan.

Definisi yang agak bertele-tele mencerminkan dua fakta sederhana:

  1. Showcase dari jenis "Raw Data Marts" dibangun di atas RAW (RAW) DATA VAULT, sebuah repositori yang hanya berisi konsep dasar: HUBS, LINKS, SATELIT;
  2. Pameran "Information Marts" dibangun menggunakan elemen BUSINESS VAULT: PIT, BRIDGE.

Jika kita beralih ke contoh menyimpan informasi tentang seorang karyawan, kita dapat mengatakan bahwa etalase yang menampilkan nomor telepon karyawan saat ini (saat ini) adalah etalase dari jenis "Raw Data Marts". Untuk membentuk etalase seperti itu, kunci bisnis karyawan dan fungsi MAX() yang digunakan pada atribut tanggal pemuatan satelit (MAX(SatLoadDate)) digunakan. Ketika diperlukan untuk menyimpan riwayat perubahan atribut di etalase - itu digunakan, Anda perlu memahami dari tanggal berapa telepon diperbarui, kompilasi kunci bisnis dan tanggal unggah ke satelit akan menambahkan kunci utama ke tabel tersebut, bidang tanggal akhir masa berlaku juga ditambahkan.

Membuat etalase yang menyimpan informasi terkini untuk setiap atribut dari beberapa satelit yang termasuk dalam hub, misalnya, nomor telepon, alamat, nama lengkap, menyiratkan penggunaan tabel PIT, yang memudahkan untuk mengakses semua tanggal relevansi. Etalase jenis ini disebut sebagai "Information Marts".

Kedua pendekatan tersebut relevan untuk pengukuran dan fakta.

Untuk membuat etalase yang menyimpan informasi tentang beberapa tautan dan hub, akses ke tabel BRIDGE dapat digunakan.

Dengan artikel ini, saya melengkapi seri tentang konsep DATA VAULT, semoga informasi yang saya bagikan bermanfaat dalam implementasi proyek Anda.

Seperti biasa, sebagai kesimpulan, beberapa tautan bermanfaat:

  • Artikel Kenta Graziano, yang selain penjelasan rinci, berisi diagram model;

Sumber: www.habr.com

Tambah komentar