Sviluppu di DATA VAULT è transizione à BUSINESS DATA VAULT

In l'articulu precedente, aghju parlatu di i principii di DATA VAULT, discrittu l'elementi principali di DATA VAULT è u so scopu. Questu ùn pò micca esse cunsideratu u tema di DATA VAULT cum'è esauritu; hè necessariu di parlà di i prossimi passi in l'evoluzione di DATA VAULT.

È in questu articulu mi cuncintraraghju nantu à u sviluppu di DATA VAULT è a transizione à BUSINESS DATA VAULT o simpliciamente BUSINESS VAULT.

Motivi per l'apparizione di BUSINESS DATA VAULT

Si deve esse nutatu chì DATA VAULT, mentri aviri certi punti di forza, ùn hè micca senza i so inconvenienti. Unu di sti svantaghji hè a difficultà à scrive dumande analitiche. E dumande anu un numeru significativu di JOIN, u codice hè longu è ingombrante. Inoltre, i dati chì entranu in DATA VAULT ùn anu micca trasfurmazioni, per quessa, da un puntu di vista cummerciale, DATA VAULT in a so forma pura ùn hà micca valore assolutu.

Hè per eliminà sti difetti chì a metodulugia DATA VAULT hè stata allargata cù elementi cum'è:

  • PIT (point in time) tables;
  • tavule BRIDGE;
  • DERIVAZIONI PREDEFINITI.

Fighjemu un ochju più vicinu à u scopu di sti elementi.

Tavule PIT

Di genere, una entità cummerciale (HUB) pò cuntene dati cù diverse rate d'aghjurnamentu, per esempiu, se parlemu di dati chì caratterizeghjanu una persona, pudemu dì chì l'infurmazioni nantu à un numeru di telefunu, indirizzu o email hà una tarifa d'aghjurnamentu più altu ch'è dì, nome cumpletu, dati di passaportu, status civile o sessu.

Dunque, quandu si determinanu i satelliti, duvete tene in mente a so frequenza di aghjurnamentu. Perchè hè impurtante?

Se guardate attributi cù diverse rate d'aghjurnamentu in a stessa tavula, avete da aghjunghje una fila à a tavula ogni volta chì l'attributu cambiatu più freti hè aghjurnatu. U risultatu hè un aumentu di u spaziu di discu è un aumentu di u tempu di esecuzione di a dumanda.

Avà chì avemu divisu i satelliti per a frequenza di l'aghjurnamentu, è pudemu carricà e dati in elli indipindentamente, duvemu assicurà chì pudemu riceve dati aghjurnati. Megliu, senza aduprà JOIN innecessarii.

Lasciami spiegà, per esempiu, avete bisognu di ottene l'infurmazione attuale (sicondu a data di l'ultima aghjurnazione) da i satelliti chì anu diverse rate d'aghjurnamentu. Per fà questu, avete bisognu micca solu di fà un JOIN, ma ancu di creà parechje dumande nidificate (per ogni satellitu chì cuntene infurmazione) cù a selezzione di a data di aghjurnamentu massima MAX (Update Date). Cù ogni novu JOIN, tali codice cresce è diventa assai prestu difficiule di capiscenu.

A tavula PIT hè pensata per simplificà tali dumande; I tavulini PIT sò pieni simultaneamente cù a scrittura di novi dati à u DATA VAULT. Tavola PIT:

Sviluppu di DATA VAULT è transizione à BUSINESS DATA VAULT

Cusì, avemu infurmazione nantu à a rilevanza di e dati per tutti i satelliti in ogni puntu in u tempu. Utilizendu JOIN à a tavola PIT, pudemu eliminà cumplettamente e dumande nidificate, naturalmente cù a cundizione chì u PIT hè pienu ogni ghjornu è senza spazii. Ancu s'ellu ci sò lacune in u PIT, pudete uttene l'ultime dati solu usendu una dumanda nidificata à u PIT stessu. Una dumanda nidificata processerà più veloce di e dumande nidificate à ogni satellitu.

PONTE

I tavule BRIDGE sò ancu usati per simplificà e dumande analitiche. Tuttavia, ciò chì differisce da PIT hè un mezzu per simplificà è accelerà e dumande trà diversi hub, ligami è i so satelliti.

A tavula cuntene tutte e chjave necessarie per tutti i satelliti, chì sò spessu usati in dumande. Inoltre, se ne necessariu, i chjavi di l'affari hashed ponu esse supplementati cù chjavi in ​​forma di testu se i nomi di e chjave sò necessarii per l'analisi.

U fattu hè chì senza usu BRIDGE, in u prucessu di riceve dati situati in satelliti chì appartenenu à diversi hubs, serà necessariu di fà un JOIN micca solu di i satelliti stessi, ma ancu di i ligami chì culliganu i hubs.

A prisenza o l'absenza di BRIDGE hè determinata da a cunfigurazione di almacenamiento è a necessità di ottimisà a velocità di l'esekzione di a dumanda. Hè difficiuli di vene cun un esempiu universale di BRIGE.

DERIVAZIONI PREDEFINITI

Un altru tipu d'ughjettu chì ci porta più vicinu à a VAULT DI DATA DI BUSINESS sò tavule chì cuntenenu indicatori pre-calculati. Tali tavule sò veramente impurtanti per l'affari; cuntenenu informazioni aggregate secondu e regule date è facenu relativamente faciule d'accessu.

Architecturally, DERIVAZIONI PREDEFINIS ùn sò nunda di più chè un altru satellitu di un certu hub. Hè, cum'è un satellitu regulare, cuntene una chjave cummerciale è a data di creazione di u record in u satellitu. Questu hè induve finiscinu e similitude, però. A più cumpusizioni di l'attributi di un tali satellitu "specializatu" hè determinata da l'utilizatori di l'affari basatu annantu à l'indicatori più populari, pre-calculati.

Per esempiu, un hub chì cuntene infurmazione nantu à un impiigatu pò include un satellitu cù indicatori cum'è:

  • salariu minimu;
  • Salariu massimu;
  • Salariu mediu;
  • Total cumulativu di i salarii accumulati, etc.

Hè logicu include DERIVAZIONI PREDEFINITI in a tavola PIT di u stessu hub, allora pudete facilmente ottene fette di dati per un impiigatu in una data specificamente selezziunata.

CONCLUSIONES

Comu a pratica mostra, l'usu di DATA VAULT da l'utilizatori di l'affari hè un pocu difficiule per parechje ragioni:

  • U codice di dumanda hè cumplessu è ingombrante;
  • L'abbundanza di JOIN afecta u rendiment di e dumande;
  • A scrittura di e dumande analitiche richiede una cunniscenza eccezziunale di u disignu di almacenamiento.

Per simplificà l'accessu di dati, DATA VAULT hè allargatu cù oggetti supplementari:

  • PIT (point in time) tables;
  • tavule BRIDGE;
  • DERIVAZIONI PREDEFINITI.

Dopu articulu Pensu di dì, in my opinion, a cosa più interessante per quelli chì travaglianu cù BI. I vi prisintari maneri di creà tavule di fatti è tavule di dimensione basatu nantu DATA VAULT.

I materiali di l'articulu sò basati nantu à:

  • nantu publicazioni Kenta Graziano, chì, in più di una descrizzione detallata, cuntene diagrammi di mudelli;
  • Libru: "Custruì un magazzinu di dati scalabile cù DATA VAULT 2.0";
  • Articulu Fundamenti di Data Vault.

Source: www.habr.com

Add a comment