Data marts DATA VAULT

Στο προηγούμενο άρθρα, έχουμε δει τα βασικά του DATA VAULT, επεκτείνοντας το DATA VAULT σε μια πιο αναλύσιμη κατάσταση και δημιουργώντας ένα BUSINESS DATA VAULT. Ήρθε η ώρα να τελειώσει η σειρά με το τρίτο άρθρο.

Όπως ανακοίνωσα στο προηγούμενο Δημοσίευση, αυτό το άρθρο θα επικεντρωθεί στο θέμα του BI, ή μάλλον στην προετοιμασία του DATA VAULT ως πηγής δεδομένων για το BI. Ας δούμε πώς να δημιουργήσουμε πίνακες γεγονότων και διαστάσεων και έτσι να δημιουργήσουμε ένα σχήμα αστεριών.

Όταν άρχισα να μελετώ αγγλόφωνο υλικό σχετικά με το θέμα της δημιουργίας data marts μέσω DATA VAULT, ένιωσα ότι η διαδικασία ήταν μάλλον περίπλοκη. Δεδομένου ότι τα άρθρα έχουν μεγάλη έκταση, υπάρχουν αναφορές σε αλλαγές στη διατύπωση που εμφανίστηκαν στη μεθοδολογία Data Vault 2.0, υποδεικνύεται η σημασία αυτών των διατυπώσεων.

Ωστόσο, έχοντας εμβαθύνει στη μετάφραση, έγινε σαφές ότι αυτή η διαδικασία δεν είναι τόσο περίπλοκη. Αλλά μπορεί να έχετε διαφορετική άποψη.

Και έτσι, ας πάμε στην ουσία.

Πίνακες διαστάσεων και γεγονότων στο DATA VAULT

Οι πιο δύσκολες πληροφορίες για κατανόηση:

  • Οι πίνακες μέτρησης βασίζονται σε πληροφορίες από κόμβους και τους δορυφόρους τους.
  • Οι πίνακες δεδομένων βασίζονται σε πληροφορίες από συνδέσμους και τους δορυφόρους τους.

Και αυτό είναι προφανές μετά την ανάγνωση του άρθρου σχετικά Βασικά στοιχεία του DATA VAULT. Οι κόμβοι αποθηκεύουν μοναδικά κλειδιά επιχειρηματικών αντικειμένων, οι δορυφόροι τους με χρονική δέσμευση των χαρακτηριστικών κατάστασης των επιχειρηματικών αντικειμένων, οι δορυφόροι που συνδέονται με συνδέσμους που υποστηρίζουν συναλλαγές αποθηκεύουν τα αριθμητικά χαρακτηριστικά αυτών των συναλλαγών.

Εδώ τελειώνει βασικά η θεωρία.

Ωστόσο, κατά τη γνώμη μου, είναι απαραίτητο να σημειώσουμε μερικές έννοιες που μπορούν να βρεθούν σε άρθρα σχετικά με τη μεθοδολογία DATA VAULT:

  • Raw Data Marts - προθήκες "ακατέργαστων" δεδομένων.
  • Information Marts - προθήκες πληροφοριών.

Η έννοια των "Raw Data Marts" - υποδηλώνει μάρκες που έχουν δημιουργηθεί πάνω από δεδομένα DATA VAULT με την εκτέλεση αρκετά απλών JOIN. Η προσέγγιση "Raw Data Marts" σάς επιτρέπει να επεκτείνετε ευέλικτα και γρήγορα το έργο της αποθήκης με πληροφορίες κατάλληλες για ανάλυση. Αυτή η προσέγγιση δεν περιλαμβάνει την εκτέλεση σύνθετων μετασχηματισμών δεδομένων και την εκτέλεση επιχειρηματικών κανόνων πριν τοποθετηθούν στη βιτρίνα, ωστόσο, τα δεδομένα Raw Data Marts θα πρέπει να είναι κατανοητά από τον επιχειρηματικό χρήστη και θα πρέπει να χρησιμεύουν ως βάση για περαιτέρω μετασχηματισμό, για παράδειγμα, από εργαλεία BI .

Η έννοια του "Information Marts" εμφανίστηκε στη μεθοδολογία Data Vault 2.0, αντικατέστησε την παλιά έννοια του "Data Marts". Αυτή η αλλαγή οφείλεται στην υλοποίηση του έργου της εφαρμογής ενός μοντέλου δεδομένων για την αναφορά ως μετατροπή των δεδομένων σε πληροφορίες. Το σύστημα «Information Marts», πρώτα απ' όλα, θα πρέπει να παρέχει στην επιχείρηση πληροφορίες κατάλληλες για λήψη αποφάσεων.

Οι μάλλον λεκτικοί ορισμοί αντικατοπτρίζουν δύο απλά γεγονότα:

  1. Οι βιτρίνες του τύπου "Raw Data Marts" είναι χτισμένες σε ένα ακατέργαστο (RAW) DATA VAULT, ένα αποθετήριο που περιέχει μόνο τις βασικές έννοιες: HUBS, LINKS, SATELLITES.
  2. Οι βιτρίνες "Information Marts" κατασκευάζονται χρησιμοποιώντας στοιχεία του BUSINESS VAULT: PIT, BRIDGE.

Αν στραφούμε σε παραδείγματα αποθήκευσης πληροφοριών σχετικά με έναν υπάλληλο, μπορούμε να πούμε ότι μια βιτρίνα που εμφανίζει τον τρέχοντα (τρέχοντα) αριθμό τηλεφώνου ενός υπαλλήλου είναι μια βιτρίνα του τύπου "Raw Data Marts". Για να σχηματιστεί μια τέτοια βιτρίνα, χρησιμοποιούνται το επιχειρηματικό κλειδί του υπαλλήλου και η συνάρτηση MAX() που χρησιμοποιείται στο χαρακτηριστικό φόρτωσης δορυφόρου (MAX(SatLoadDate)). Όταν απαιτείται η αποθήκευση του ιστορικού των αλλαγών χαρακτηριστικών στη βιτρίνα - χρησιμοποιείται, πρέπει να καταλάβετε από ποια ημερομηνία ήταν ενημερωμένο το τηλέφωνο, τη συλλογή του κλειδιού επιχείρησης και την ημερομηνία μεταφόρτωσης στον δορυφόρο θα προσθέσει το πρωτεύον κλειδί σε έναν τέτοιο πίνακα, προστίθεται επίσης το πεδίο της ημερομηνίας λήξης της περιόδου ισχύος.

Η δημιουργία μιας βιτρίνας που αποθηκεύει ενημερωμένες πληροφορίες για κάθε χαρακτηριστικό πολλών δορυφόρων που περιλαμβάνονται στο διανομέα, για παράδειγμα, αριθμός τηλεφώνου, διεύθυνση, πλήρες όνομα, συνεπάγεται τη χρήση πίνακα PIT, μέσω του οποίου είναι εύκολη η πρόσβαση σε όλες τις ημερομηνίες συνάφειας. Οι βιτρίνες αυτού του τύπου αναφέρονται ως "Information Marts".

Και οι δύο προσεγγίσεις είναι σχετικές τόσο για μετρήσεις όσο και για γεγονότα.

Για να δημιουργήσετε βιτρίνες που αποθηκεύουν πληροφορίες σχετικά με πολλούς συνδέσμους και κόμβους, μπορεί να χρησιμοποιηθεί η πρόσβαση σε πίνακες BRIDGE.

Με αυτό το άρθρο, ολοκληρώνω τη σειρά για την έννοια του DATA VAULT, ελπίζω οι πληροφορίες που μοιράστηκα να είναι χρήσιμες στην υλοποίηση των έργων σας.

Όπως πάντα, εν κατακλείδι, μερικοί χρήσιμοι σύνδεσμοι:

  • Άρθρο Kenta Graziano, το οποίο, εκτός από λεπτομερή περιγραφή, περιέχει διαγράμματα μοντέλων.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο