DATA VAULT-ի մշակում և անցում BUSINESS DATA VAULT-ին

Նախորդ հոդվածում ես խոսեցի DATA VAULT-ի հիմունքների մասին, նկարագրեցի DATA VAULT-ի հիմնական տարրերը և դրանց նպատակը: Սա չի կարելի DATA VAULT-ի թեման սպառված համարել, անհրաժեշտ է խոսել DATA VAULT-ի էվոլյուցիայի հետագա քայլերի մասին։

Եվ այս հոդվածում ես կկենտրոնանամ DATA VAULT-ի զարգացման և BUSINESS DATA VAULT-ի կամ պարզապես BUSINESS VAULT-ի անցման վրա:

BUSINESS DATA VAULT-ի առաջացման պատճառները

Հարկ է նշել, որ DATA VAULT-ը, ունենալով որոշակի ուժեղ կողմեր, զերծ չէ իր թերություններից: Այս թերություններից մեկը վերլուծական հարցումներ գրելու դժվարությունն է: Հարցումները ունեն զգալի թվով JOIN-ներ, կոդը երկար է և ծանր: Նաև DATA VAULT մուտքագրվող տվյալները չեն ենթարկվում որևէ փոխակերպման, հետևաբար, բիզնեսի տեսանկյունից, DATA VAULT-ն իր մաքուր ձևով բացարձակ արժեք չունի:

Այս թերությունները վերացնելու համար էր, որ DATA VAULT մեթոդոլոգիան ընդլայնվեց այնպիսի տարրերով, ինչպիսիք են.

  • PIT (ժամանակի կետ) աղյուսակներ;
  • BRIDGE սեղաններ;
  • ՆԱԽԱՍԱՀՄԱՆՎԱԾ ԱԴՐԻՎԱՑԻՆԵՐ.

Եկեք ավելի սերտ նայենք այս տարրերի նպատակին:

PIT սեղաններ

Սովորաբար, մեկ ձեռնարկատիրական կազմակերպություն (HUB) կարող է պարունակել տվյալներ թարմացման տարբեր տեմպերով, օրինակ, եթե մենք խոսում ենք անձին բնութագրող տվյալների մասին, ապա կարող ենք ասել, որ հեռախոսահամարի, հասցեի կամ էլփոստի մասին տեղեկատվությունը թարմացման ավելի բարձր արագություն ունի, քան ասենք. լրիվ անունը, անձնագրի տվյալները, ամուսնական կարգավիճակը կամ սեռը.

Հետեւաբար, արբանյակները որոշելիս պետք է նկատի ունենալ դրանց թարմացման հաճախականությունը: Ինչու՞ է դա կարևոր:

Եթե ​​դուք նույն աղյուսակում պահում եք ատրիբուտներ թարմացման տարբեր արագություններով, դուք պետք է տող ավելացնեք աղյուսակում ամեն անգամ, երբ ամենահաճախ փոփոխվող հատկանիշը թարմացվում է: Արդյունքը սկավառակի տարածության ավելացումն է և հարցումների կատարման ժամանակի ավելացումը:

Այժմ, երբ մենք բաժանել ենք արբանյակները ըստ թարմացման հաճախականության և կարող ենք ինքնուրույն բեռնել տվյալները դրանց մեջ, մենք պետք է ապահովենք, որ մենք կարողանանք ստանալ արդի տվյալներ: Ավելի լավ է՝ չօգտագործելով ավելորդ JOIN-ներ:

Թույլ տվեք բացատրել, օրինակ, դուք պետք է ստանաք ընթացիկ (ըստ վերջին թարմացման ամսաթվի) տեղեկատվություն այն արբանյակներից, որոնք թարմացման տարբեր արագություններ ունեն: Դա անելու համար ձեզ հարկավոր է ոչ միայն JOIN կատարել, այլև ստեղծել մի քանի ներդիր հարցումներ (տեղեկատվություն պարունակող յուրաքանչյուր արբանյակի համար) առավելագույն թարմացման ամսաթիվը ընտրելով MAX (Թարմացման ամսաթիվ): Յուրաքանչյուր նոր JOIN-ի հետ նման կոդը մեծանում է և շատ արագ դառնում դժվար հասկանալի:

PIT աղյուսակը նախատեսված է նման հարցումները պարզեցնելու համար, PIT աղյուսակները լրացվում են միաժամանակ՝ նոր տվյալներ DATA VAULT-ում գրելով: PIT աղյուսակ.

DATA VAULT-ի մշակում և անցում BUSINESS DATA VAULT-ին

Այսպիսով, մենք տեղեկություններ ունենք բոլոր արբանյակների տվյալների համապատասխանության մասին ժամանակի յուրաքանչյուր կետում: Օգտագործելով PIT աղյուսակի JOIN-ները, մենք կարող ենք ամբողջությամբ վերացնել ներկառուցված հարցումները, բնականաբար, պայմանով, որ PIT-ը լրացվի ամեն օր և առանց բացերի: Նույնիսկ եթե PIT-ում բացեր կան, դուք կարող եք ստանալ վերջին տվյալները՝ օգտագործելով միայն մեկ ներդիր հարցումը հենց PIT-ում: Մեկ ներդիր հարցումը կմշակվի ավելի արագ, քան յուրաքանչյուր արբանյակի վրա տեղադրված հարցումները:

BRIDGE

BRIDGE աղյուսակները նույնպես օգտագործվում են վերլուծական հարցումները պարզեցնելու համար: Այնուամենայնիվ, PIT-ից տարբերվողը տարբեր հանգույցների, կապերի և դրանց արբանյակների միջև հարցումները պարզեցնելու և արագացնելու միջոց է:

Աղյուսակը պարունակում է բոլոր անհրաժեշտ բանալիները բոլոր արբանյակների համար, որոնք հաճախ օգտագործվում են հարցումներում: Բացի այդ, անհրաժեշտության դեպքում, հաշված բիզնես բանալիները կարող են համալրվել տեքստային ձևով ստեղներով, եթե վերլուծության համար անհրաժեշտ են ստեղների անունները:

Փաստն այն է, որ առանց BRIDGE-ի օգտագործման, տարբեր հանգույցներին պատկանող արբանյակներում գտնվող տվյալների ստացման գործընթացում անհրաժեշտ կլինի JOIN կատարել ոչ միայն բուն արբանյակների, այլ նաև հանգույցները միացնող հղումների:

BRIDGE-ի առկայությունը կամ բացակայությունը որոշվում է պահեստավորման կազմաձևով և հարցումների կատարման արագությունը օպտիմալացնելու անհրաժեշտությամբ: Դժվար է BRIGE-ի ունիվերսալ օրինակ բերելը:

ՆԱԽԱՍԱՀՄԱՆՎԱԾ ԱԴՐԻՎԱՑԻՆԵՐ

Մեկ այլ տեսակի օբյեկտ, որը մեզ մոտեցնում է ԲԻԶՆԵՍ ՏՎՅԱԼՆԵՐԻ VAULT-ին, նախապես հաշվարկված ցուցանիշներ պարունակող աղյուսակներն են: Նման աղյուսակները իսկապես կարևոր են բիզնեսի համար, դրանք պարունակում են տվյալ կանոնների համաձայն հավաքագրված տեղեկատվություն և համեմատաբար հեշտացնում են դրանց հասանելիությունը:

Ճարտարապետական ​​առումով, ՆԱԽԱՍԱՀՄԱՆՎԱԾ ածանցյալները ոչ այլ ինչ են, քան որոշակի հանգույցի հերթական արբանյակը: Այն, ինչպես սովորական արբանյակը, պարունակում է բիզնես բանալին և արբանյակում գրանցման ստեղծման ամսաթիվը: Սակայն այստեղ ավարտվում են նմանությունները: Նման «մասնագիտացված» արբանյակի ատրիբուտների հետագա կազմը որոշվում է բիզնես օգտագործողների կողմից՝ ամենահայտնի, նախապես հաշվարկված ցուցանիշների հիման վրա:

Օրինակ՝ աշխատողի մասին տեղեկատվություն պարունակող հանգույցը կարող է ներառել արբանյակ՝ այնպիսի ցուցիչներով, ինչպիսիք են.

  • Նվազագույն աշխատավարձը;
  • Առավելագույն աշխատավարձ;
  • Միջին աշխատավարձ;
  • Հաշվարկված աշխատավարձերի կուտակային ընդհանուր գումարը և այլն:

Տրամաբանական է նույն հանգույցի PIT աղյուսակում ներառել ՆԱԽԱՍԱՀՄԱՆԱՑՎԱԾ ԴԵՐԻՎԱՑԻՆԵՐ, այնուհետև կարող եք հեշտությամբ ձեռք բերել տվյալների հատվածներ աշխատողի համար հատուկ ընտրված ամսաթվով:

Եզրակացություններ

Ինչպես ցույց է տալիս պրակտիկան, DATA VAULT-ի օգտագործումը բիզնես օգտագործողների կողմից որոշ չափով դժվար է մի քանի պատճառներով.

  • Հարցման կոդը բարդ է և ծանր;
  • JOIN-ների առատությունը ազդում է հարցումների կատարման վրա.
  • Վերլուծական հարցումներ գրելը պահանջում է պահեստավորման դիզայնի գերազանց իմացություն:

Տվյալների հասանելիությունը պարզեցնելու համար DATA VAULT-ն ընդլայնվում է լրացուցիչ օբյեկտներով.

  • PIT (ժամանակի կետ) աղյուսակներ;
  • BRIDGE սեղաններ;
  • ՆԱԽԱՍԱՀՄԱՆՎԱԾ ԱԴՐԻՎԱՑԻՆԵՐ.

Հաջորդը Հոդված Ես նախատեսում եմ պատմել, իմ կարծիքով, ամենահետաքրքիրը նրանց համար, ովքեր աշխատում են BI-ի հետ։ Ես կներկայացնեմ DATA VAULT-ի հիման վրա փաստերի աղյուսակներ և չափումների աղյուսակներ ստեղծելու եղանակներ:

Հոդվածի նյութերը հիմնված են.

Source: www.habr.com

Добавить комментарий