Data marts DATA VALV

I föregående artiklar, vi har sett grunderna i DATA VALV, utvidga DATA VALV till ett mer tolkbart tillstånd och skapa ett BUSINESS DATA VALV. Det är dags att avsluta serien med den tredje artikeln.

Som jag meddelade i föregående Publikation, kommer den här artikeln att fokusera på ämnet BI, eller snarare beredningen av DATA VAULT som en datakälla för BI. Låt oss titta på hur man skapar fakta- och dimensionstabeller och på så sätt skapar ett stjärnschema.

När jag började studera engelskspråkigt material på temat att skapa datamarts över DATA VAULT, hade jag en känsla av att processen var ganska komplicerad. Eftersom artiklarna är av betydande längd finns det hänvisningar till ändringar i formuleringarna som förekom i Data Vault 2.0-metoden, vikten av dessa formuleringar anges.

Men efter att ha fördjupat sig i översättningen blev det klart att denna process inte är så komplicerad. Men du kanske har en annan åsikt.

Och så, låt oss komma till saken.

Dimensions- och faktatabeller i DATA VALV

Den svåraste informationen att förstå:

  • Mättabeller bygger på information från hubbar och deras satelliter;
  • Faktatabeller bygger på information från länkar och deras satelliter.

Och detta är uppenbart efter att ha läst artikeln om DATA VAULT grunderna. Hubs lagrar unika nycklar för affärsobjekt, deras tidsbundna satelliter för tillståndet för affärsobjektattribut, satelliter kopplade till länkar som stöder transaktioner lagrar de numeriska egenskaperna för dessa transaktioner.

Det är där teorin i princip slutar.

Men ändå, enligt min mening, är det nödvändigt att notera ett par begrepp som kan hittas i artiklar om DATA VAULT-metoden:

  • Raw Data Marts - uppvisning av "rå" data;
  • Information Marts - informationsutställningar.

Konceptet "Raw Data Marts" - betecknar mars byggda över DATA VAULT-data genom att utföra ganska enkla JOINs. "Raw Data Marts"-metoden tillåter dig att flexibelt och snabbt utöka lagerprojektet med information som lämpar sig för analys. Detta tillvägagångssätt involverar inte att utföra komplexa datatransformationer och exekvera affärsregler innan de placeras i skyltfönstret, men Raw Data Marts-data bör vara begripliga för affärsanvändaren och bör fungera som en grund för ytterligare transformation, till exempel med BI-verktyg .

Konceptet "Information Marts" dök upp i Data Vault 2.0-metoden, det ersatte det gamla konceptet "Data Marts". Denna förändring beror på förverkligandet av uppgiften att implementera en datamodell för rapportering som en omvandling av data till information. Systemet "Information Marts" bör först och främst ge företaget information som är lämplig för beslutsfattande.

Ganska ordrika definitioner återspeglar två enkla fakta:

  1. Showcases av typen "Raw Data Marts" är byggda på ett rådatavalv (RAW), ett arkiv som endast innehåller de grundläggande begreppen: HUBS, LÄNKAR, SATELLITER;
  2. Showcases "Information Marts" är byggda med hjälp av delar av BUSINESS VAULT: PIT, BRIDGE.

Om vi ​​vänder oss till exempel på att lagra information om en anställd kan vi säga att ett skyltfönster som visar det aktuella (aktuella) telefonnummer till en anställd är ett skyltfönster av typen "Raw Data Marts". För att skapa ett sådant skyltfönster används medarbetarens affärsnyckel och MAX()-funktionen som används på satellitladdningsdatumattributet (MAX(SatLoadDate)). När det krävs att lagra historiken för attributändringar i skyltfönstret - det används, måste du förstå från vilket datum telefonen var uppdaterad, sammanställningen av affärsnyckeln och uppladdningsdatumet till satelliten kommer att lägga till primärnyckeln till en sådan tabell, läggs även fältet för slutdatumet för giltighetsperioden till.

Att skapa ett skyltfönster som lagrar uppdaterad information för varje attribut för flera satelliter som ingår i navet, till exempel telefonnummer, adress, fullständigt namn, innebär användning av en PIT-tabell, genom vilken det är lätt att komma åt alla datum av relevans. Showcases av denna typ kallas "Information Marts".

Båda tillvägagångssätten är relevanta för både mätningar och fakta.

För att skapa skyltfönster som lagrar information om flera länkar och hubbar kan åtkomst till BRIDGE-tabeller involveras.

Med den här artikeln kompletterar jag serien om konceptet DATA VAULT, jag hoppas att informationen som jag delade kommer att vara användbar i genomförandet av dina projekt.

Som alltid, avslutningsvis, några användbara länkar:

  • Artikel Kenta Graziano, som förutom en detaljerad beskrivning innehåller modelldiagram;

Källa: will.com

Lägg en kommentar