Ανάπτυξη του DATA VAULT και μετάβαση στο BUSINESS DATA VAULT

Στο προηγούμενο άρθρο, μίλησα για τα βασικά του DATA VAULT, περιέγραψα τα κύρια στοιχεία του DATA VAULT και τον σκοπό τους. Σε αυτό το σημείο, το θέμα του DATA VAULT δεν μπορεί να θεωρηθεί εξαντλημένο, είναι απαραίτητο να μιλήσουμε για τα επόμενα βήματα στην εξέλιξη του DATA VAULT.

Και σε αυτό το άρθρο, θα επικεντρωθώ στην ανάπτυξη του DATA VAULT και στη μετάβαση στο BUSINESS DATA VAULT ή απλά BUSINESS VAULT.

Λόγοι για την εμφάνιση του BUSINESS DATA VAULT

Πρέπει να σημειωθεί ότι το DATA VAULT, έχοντας ορισμένα δυνατά σημεία, δεν είναι χωρίς μειονεκτήματα. Ένα από αυτά τα μειονεκτήματα είναι η δυσκολία σύνταξης αναλυτικών ερωτημάτων. Τα ερωτήματα έχουν σημαντικό αριθμό JOIN, ο κώδικας είναι μακρύς και δυσκίνητος. Επίσης, τα δεδομένα που εισέρχονται στο DATA VAULT δεν υπόκεινται σε μετασχηματισμούς, επομένως, από επιχειρηματική άποψη, το DATA VAULT στην καθαρή του μορφή δεν έχει καμία ανεπιφύλακτη αξία.

Για την εξάλειψη αυτών των αδυναμιών επεκτάθηκε η μεθοδολογία DATA VAULT με στοιχεία όπως:

  • Πίνακες PIT (σημείο στο χρόνο).
  • BRIDGE τραπέζια;
  • ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΑΡΑΓΩΓΕΣ.

Ας ρίξουμε μια πιο προσεκτική ματιά στον σκοπό αυτών των στοιχείων.

Πίνακες PIT

Κατά κανόνα, ένα επιχειρηματικό αντικείμενο (HUB) μπορεί να περιέχει δεδομένα με διαφορετικούς ρυθμούς ενημέρωσης, για παράδειγμα, εάν μιλάμε για δεδομένα που χαρακτηρίζουν ένα άτομο, μπορούμε να πούμε ότι οι πληροφορίες σχετικά με έναν αριθμό τηλεφώνου, διεύθυνση ή email έχουν υψηλότερο ρυθμό ενημέρωσης από ας πούμε, πλήρες όνομα, στοιχεία διαβατηρίου, οικογενειακή κατάσταση ή φύλο.

Επομένως, κατά τον προσδιορισμό των δορυφόρων, θα πρέπει να λαμβάνεται υπόψη η συχνότητα της ανανέωσής τους. Γιατί είναι σημαντικό?

Εάν αποθηκεύετε χαρακτηριστικά με διαφορετικούς ρυθμούς ενημέρωσης στον ίδιο πίνακα, θα πρέπει να προσθέτετε μια σειρά στον πίνακα κάθε φορά που ενημερώνεται το χαρακτηριστικό που αλλάζει συχνότερα. Ως αποτέλεσμα, υπάρχει αύξηση του χώρου στο δίσκο, αύξηση του χρόνου εκτέλεσης των ερωτημάτων.

Τώρα που έχουμε διαχωρίσει τους δορυφόρους κατά ρυθμό ενημέρωσης και μπορούμε να φορτώσουμε δεδομένα σε αυτούς ανεξάρτητα, πρέπει να διασφαλίσουμε ότι μπορούμε να λάβουμε ενημερωμένα δεδομένα. Καλύτερα χωρίς τη χρήση περιττών JOIN.

Επιτρέψτε μου να εξηγήσω, για παράδειγμα, πρέπει να λαμβάνετε ενημερωμένες (μέχρι την ημερομηνία της τελευταίας ενημέρωσης) πληροφορίες από δορυφόρους με διαφορετικούς ρυθμούς ενημέρωσης. Για να το κάνετε αυτό, θα χρειαστεί όχι μόνο να κάνετε JOIN, αλλά και να δημιουργήσετε πολλά ένθετα ερωτήματα (για κάθε δορυφόρο που περιέχει πληροφορίες) με επιλογή της μέγιστης ημερομηνίας ενημέρωσης MAX (Ημερομηνία ενημέρωσης). Με κάθε νέο JOIN, αυτός ο κώδικας μεγαλώνει και γίνεται πολύ γρήγορα δύσκολος στην κατανόηση.

Ο πίνακας PIT έχει σχεδιαστεί για να απλοποιεί τέτοια ερωτήματα, οι πίνακες PIT συμπληρώνονται ταυτόχρονα με την εγγραφή νέων δεδομένων στο DATA VAULT. Πίνακας PIT:

Ανάπτυξη του DATA VAULT και μετάβαση στο BUSINESS DATA VAULT

Έτσι, έχουμε πληροφορίες σχετικά με τη συνάφεια των δεδομένων για όλους τους δορυφόρους σε κάθε χρονική στιγμή. Χρησιμοποιώντας JOIN στον πίνακα PIT, μπορούμε να εξαλείψουμε εντελώς τα ένθετα ερωτήματα, φυσικά με την προϋπόθεση ότι το PIT συμπληρώνεται καθημερινά και χωρίς κενά. Ακόμα κι αν υπάρχουν κενά στο PIT, μπορείτε να λάβετε ενημερωμένα δεδομένα μόνο χρησιμοποιώντας ένα ένθετο ερώτημα στο ίδιο το PIT. Ένα ένθετο ερώτημα θα λειτουργεί πιο γρήγορα από τα ένθετα ερωτήματα για κάθε δορυφόρο.

ΓΕΦΥΡΑ

Οι πίνακες BRIDGE χρησιμοποιούνται επίσης για την απλοποίηση των αναλυτικών ερωτημάτων. Ωστόσο, η διαφορά από το PIT είναι ένα μέσο απλοποίησης και επιτάχυνσης των αιτημάτων μεταξύ διαφόρων κόμβων, συνδέσμων και δορυφόρων τους.

Ο πίνακας περιέχει όλα τα απαραίτητα κλειδιά για όλους τους δορυφόρους που χρησιμοποιούνται συχνά σε ερωτήματα. Επιπλέον, εάν είναι απαραίτητο, τα κατακερματισμένα επιχειρηματικά κλειδιά μπορούν να συμπληρωθούν με κλειδιά σε μορφή κειμένου, εάν τα ονόματα των κλειδιών χρειάζονται για ανάλυση.

Το γεγονός είναι ότι χωρίς τη χρήση του BRIDGE, κατά τη διαδικασία λήψης δεδομένων που βρίσκονται σε δορυφόρους που ανήκουν σε διαφορετικούς κόμβους, θα χρειαστεί να ΣΥΝΔΕΘΕΙΤΕ όχι μόνο οι ίδιοι οι δορυφόροι, αλλά και οι σύνδεσμοι που συνδέουν τους κόμβους.

Η παρουσία ή η απουσία του BRIDGE καθορίζεται από τη διαμόρφωση αποθήκευσης, την ανάγκη βελτιστοποίησης της ταχύτητας εκτέλεσης ερωτήματος. Είναι δύσκολο να βρεις ένα παγκόσμιο παράδειγμα BRIGE.

ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΑΡΑΓΩΓΕΣ

Ένας άλλος τύπος αντικειμένων που μας φέρνει πιο κοντά στο BUSINESS DATA VAULT είναι πίνακες που περιέχουν προ-υπολογισμένους δείκτες. Τέτοιοι πίνακες είναι πραγματικά σημαντικοί για τις επιχειρήσεις, περιέχουν πληροφορίες συγκεντρωμένες σύμφωνα με δεδομένους κανόνες και καθιστούν σχετικά εύκολη την πρόσβαση.

Αρχιτεκτονικά, οι ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΑΡΑΓΩΓΕΣ δεν είναι τίποτα άλλο παρά ένας άλλος δορυφόρος ενός συγκεκριμένου κόμβου. Όπως ένας κανονικός δορυφόρος, περιέχει ένα επαγγελματικό κλειδί και την ημερομηνία δημιουργίας της εγγραφής στον δορυφόρο. Εδώ, όμως, τελειώνουν οι ομοιότητες. Η περαιτέρω σύνθεση των χαρακτηριστικών ενός τέτοιου «εξειδικευμένου» δορυφόρου καθορίζεται από τους επαγγελματίες χρήστες με βάση τους πιο δημοφιλείς, προ-υπολογισμένους δείκτες.

Για παράδειγμα, ένας κόμβος που περιέχει πληροφορίες για έναν υπάλληλο μπορεί να περιλαμβάνει έναν δορυφόρο με δείκτες όπως:

  • Κατώτατος μισθός;
  • Μέγιστος μισθός;
  • Μέσος μισθός;
  • Σωρευτικό σύνολο δεδουλευμένων μισθών κ.λπ.

Είναι λογικό να συμπεριλάβετε ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΑΡΑΓΩΓΕΣ στον πίνακα PIT του ίδιου διανομέα, τότε μπορείτε εύκολα να λάβετε φέτες δεδομένων υπαλλήλων για μια συγκεκριμένη ημερομηνία.

ΣΥΜΠΕΡΑΣΜΑΤΑ

Όπως δείχνει η πρακτική, η χρήση του DATA VAULT από επαγγελματίες χρήστες είναι κάπως δύσκολη για διάφορους λόγους:

  • Ο κώδικας ερωτήματος είναι περίπλοκος και περίπλοκος.
  • Η αφθονία των JOIN επηρεάζει την απόδοση των ερωτημάτων.
  • Η σύνταξη αναλυτικών ερωτημάτων απαιτεί εξαιρετική γνώση της δομής της αποθήκης.

Για να απλοποιηθεί η πρόσβαση στα δεδομένα, το DATA VAULT επεκτείνεται με πρόσθετα αντικείμενα:

  • Πίνακες PIT (σημείο στο χρόνο).
  • BRIDGE τραπέζια;
  • ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΑΡΑΓΩΓΕΣ.

Επόμενο άρθρο Σκοπεύω να πω, κατά τη γνώμη μου, το πιο ενδιαφέρον για όσους εργάζονται με το BI. Θα παρουσιάσω τρόπους δημιουργίας πινάκων - γεγονότων και πινάκων - διαστάσεων με βάση το DATA VAULT.

Τα υλικά του άρθρου βασίζονται σε:

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο