Sealladh farsaing air dòighean dealbhaidh Agile DWH

Is e obair fhada agus throm a th’ ann a bhith a’ leasachadh goireas stòraidh.

Tha mòran ann am beatha pròiseact an urra ri dè cho math ‘s a thathas a’ smaoineachadh air modal an nì agus an structar bunaiteach aig an toiseach.

Tha an dòigh-obrach ris an robhar a’ gabhail ris san fharsaingeachd air a bhith agus fhathast diofar dhreachan de bhith a’ cothlamadh sgeama nan rionnagan leis an treas cruth àbhaisteach. Mar riaghailt, a rèir a 'phrionnsapail: dàta tùsail - 3NF, taisbeanaidhean - rionnag. Is e an dòigh-obrach seo, air a dhearbhadh le ùine agus le taic bho tòrr rannsachaidh, a’ chiad rud (agus uaireannan an aon rud) a thig gu inntinn eòlaiche DWH eòlach nuair a bhios e a’ smaoineachadh cò ris a bu chòir a bhith coltach ri stòr anailis.

Air an làimh eile, tha gnìomhachas san fharsaingeachd agus riatanasan teachdaiche gu sònraichte buailteach atharrachadh gu sgiobalta, agus tha dàta buailteach fàs an dà chuid “ann an doimhneachd” agus “ann am farsaingeachd”. Agus seo far a bheil prìomh ana-cothrom rionnag a 'nochdadh - cuingealaichte sùbailteachd.

Agus ma tha thu nad bheatha shàmhach agus shocair mar leasaiche DWH gu h-obann:

  • dh'èirich an obair "rudeigin a dhèanamh gu luath co-dhiù, agus an uairsin chì sinn";
  • nochd pròiseact a bha a’ leasachadh gu luath, le ceangal stòran ùra agus ath-obrachadh a’ mhodail gnìomhachais co-dhiù aon turas san t-seachdain;
  • tha neach-ceannach air nochdadh aig nach eil beachd cò ris a bu chòir don t-siostam a bhith coltach agus dè na gnìomhan a bu chòir dha a choileanadh aig a’ cheann thall, ach a tha deiseil gus an toradh a tha thu ag iarraidh fheuchainn agus ùrachadh gu cunbhalach fhad ‘s a tha e gu cunbhalach a’ tighinn nas fhaisge air;
  • Thuit manaidsear a’ phròiseict leis an deagh naidheachd: “Agus a-nis tha lùths againn!”

No ma tha dìreach ùidh agad faighinn a-mach ciamar eile as urrainn dhut goireasan stòraidh a thogail - fàilte don ghearradh!

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Dè tha “sùbailteachd” a’ ciallachadh?

An toiseach, mìnichidh sinn dè na feartan a dh’ fheumas a bhith aig siostam gus a bhith air ainmeachadh mar “sùbailte”.

Air leth, is fhiach iomradh a thoirt air gum bu chòir na feartan a chaidh a mhìneachadh buntainn gu sònraichte ris siostam, chan ann gu phròiseas a leasachadh. Mar sin, ma bha thu airson leughadh mu Agile mar dhòigh leasachaidh, tha e nas fheàrr artaigilean eile a leughadh. Mar eisimpleir, dìreach an sin, air Habré, tha tòrr stuthan inntinneach (leithid lèirmheas и practaigeach, agus trioblaideach).

Chan eil seo a 'ciallachadh gu bheil am pròiseas leasachaidh agus structar an taigh-bathair dàta gu tur neo-cheangailte. Gu h-iomlan, bu chòir dha a bhith gu math nas fhasa stòr Agile a leasachadh airson ailtireachd lùthmhor. Ach, ann an cleachdadh, nas trice tha roghainnean ann le leasachadh Agile den DWH clasaigeach a rèir Kimbal agus DataVault - a rèir Waterfall, na co-thursan toilichte de shùbailteachd anns an dà chruth aige air aon phròiseact.

Mar sin, dè na comasan a bu chòir a bhith aig stòradh sùbailte? Tha trì puingean an seo:

  1. Lìbhrigeadh tràth agus tionndadh luath - tha seo a 'ciallachadh gum bu chòir a' chiad toradh gnìomhachais (mar eisimpleir, a 'chiad aithisgean obrach) fhaighinn cho tràth' sa ghabhas, is e sin, eadhon mus tèid an siostam gu lèir a dhealbhadh agus a chur an gnìomh gu h-iomlan. A bharrachd air an sin, bu chòir dha gach ath-sgrùdadh às deidh sin a bhith a’ toirt cho beag ùine ’s a ghabhas.
  2. Ath-leasachadh ath-aithriseach - tha seo a’ ciallachadh nach bu chòir dha gach leasachadh às deidh sin buaidh a thoirt air gnìomhachd a tha ag obair mar-thà. Is e an àm seo a bhios gu tric mar an trom-laighe as motha air pròiseactan mòra - nas luaithe no nas fhaide air adhart, bidh nithean fa leth a’ tòiseachadh a ’faighinn uimhir de cheanglaichean gu bheil e nas fhasa an loidsig ath-aithris gu tur ann an leth-bhreac faisg air làimh na bhith a’ cur raon ri clàr a tha ann mu thràth. Agus ma chuireas tu iongnadh ort gun toir mion-sgrùdadh air buaidh leasachaidhean air nithean a th’ ann mar-thà barrachd ùine na na leasachaidhean iad fhèin, tha e coltach nach eil thu fhathast air obrachadh le stòran dàta mòra ann am bancaireachd no tele-chonaltradh.
  3. An-còmhnaidh ag atharrachadh a rèir riatanasan gnìomhachais a tha ag atharrachadh - bu chòir structar iomlan an nì a bhith air a dhealbhadh chan ann a-mhàin a’ toirt aire do leudachadh a dh’ fhaodadh a bhith ann, ach leis an dùil nach b ’urrainnear eadhon bruadar a dhèanamh air stiùir an ath leudachaidh seo aig ìre dealbhaidh.

Agus tha, tha e comasach coinneachadh ris na riatanasan sin uile ann an aon shiostam (gu dearbh, ann an cuid de chùisean agus le beagan teagamhan).

Gu h-ìosal beachdaichidh mi air dhà de na dòighean dealbhaidh sùbailte as mòr-chòrdte airson stòran dàta - Modail anchor и Stòr-dàta. Air am fàgail a-mach às na camagan tha dòighean cho math ri, mar eisimpleir, EAV, 6NF (ann an cruth fìor) agus a h-uile càil co-cheangailte ri fuasglaidhean NoSQL - chan ann air sgàth gu bheil iad ann an dòigh air choreigin nas miosa, agus chan ann eadhon air sgàth sa chùis seo bhiodh an artaigil a ’bagairt faighinn. meud an tràchdas cuibheasach. Is e dìreach gu bheil seo uile a’ buntainn ri fuasglaidhean de chlas beagan eadar-dhealaichte - an dàrna cuid ri dòighean as urrainn dhut a chleachdadh ann an cùisean sònraichte, ge bith dè an ailtireachd iomlan sa phròiseact agad (leithid EAV), no ri paradigms stòraidh fiosrachaidh eile air feadh na cruinne (leithid stòran-dàta grafa). agus roghainnean eile NoSQL).

Duilgheadasan leis an dòigh-obrach “clasaigeach” agus na fuasglaidhean aca ann an dòighean sùbailte

Le dòigh-obrach “clasaigeach” tha mi a’ ciallachadh an t-seann rionnag math (a dh’ aindeoin buileachadh sònraichte nan sreathan bunaiteach, an toir luchd-leantainn Kimball, Inmon agus CDM mathanas dhomh).

1. Cardinality teann de cheanglaichean

Tha am modail seo stèidhichte air sgaradh soilleir de dhàta a-steach Tomhas и fìrinnean. Agus tha seo, gu dona, loidsigeach - às deidh a h-uile càil, tha mion-sgrùdadh dàta anns a ’mhòr-chuid de chùisean a’ tighinn sìos gu mion-sgrùdadh air comharran àireamhach sònraichte (fìrinn) ann an earrannan sònraichte (tomhasan).

Anns a 'chùis seo, tha ceanglaichean eadar nithean air an stèidheachadh ann an cruth dàimhean eadar bùird a' cleachdadh iuchair chèin. Tha seo a 'coimhead gu math nàdarra, ach sa bhad a' leantainn gu a 'chiad chuingealachadh sùbailteachd - mìneachadh teann air cardinality nan ceanglaichean.

Tha seo a’ ciallachadh, aig ìre dealbhaidh a’ bhùird, gum feum thu dearbhadh gu ceart airson gach paidhir de nithean co-cheangailte an urrainn dhaibh ceangal a dhèanamh eadar uimhir ri mòran, no dìreach 1-gu-mòran, agus “dè an taobh”. Bidh seo a’ dearbhadh gu dìreach dè an clàr aig a bheil am prìomh iuchair agus cò aig a bheil an iuchair chèin. Bidh e nas coltaiche gun toir atharrachadh air a’ bheachd seo nuair a gheibhear riatanasan ùra ath-obrachadh air a’ bhunait.

Mar eisimpleir, nuair a bhios tu a’ dealbhadh an nì “cuidhteas airgid”, tha thu, le bhith an urra ri bòid na roinne reic, a’ suidheachadh comas gnìomh aon àrdachadh airson grunn dhreuchdan seic (ach chan ann a chaochladh):

Sealladh farsaing air dòighean dealbhaidh Agile DWH
Agus às deidh beagan ùine, thug co-obraichean a-steach ro-innleachd margaidheachd ùr anns am faod iad a bhith san aon suidheachadh grunn sanasachd aig an aon àm. Agus a-nis feumaidh tu na clàran atharrachadh le bhith a 'sgaradh an dàimh gu nì air leth.

(Feumar a h-uile nì a thàinig às a bheil an sgrùdadh adhartachaidh a-steach a-nis a leasachadh cuideachd).

Sealladh farsaing air dòighean dealbhaidh Agile DWH
Dàimhean ann an Data Vault agus Modail Anchor

Bha e gu math sìmplidh a bhith a’ seachnadh an t-suidheachaidh seo: cha leig thu leas earbsa a bhith anns an roinn reic airson seo a dhèanamh. tha a h-uile ceangal air a stòradh an toiseach ann an clàran air leth agus giullachd e mar iomadh gu mòran.

Chaidh an dòigh-obrach seo a mholadh Dan Linstedt mar phàirt den paradigm Stòr-dàta agus làn thaic Lars Rönnbäck в Modail Anchor.

Mar thoradh air an sin, gheibh sinn a’ chiad fheart sònraichte de dhòighean-obrach sùbailte:

Chan eil dàimhean eadar nithean air an stòradh ann am feartan nam pàrant, ach tha iad nan seòrsa de nì air leth.

В Stòr-dàta canar clàran ceangail mar sin Ceangal, agus a-steach Modail Anchor - taidh. Aig a 'chiad sealladh, tha iad glè choltach, ged nach eil na h-eadar-dhealachaidhean aca a' crìochnachadh leis an ainm (a thèid a dheasbad gu h-ìosal). Anns an dà ailtireachd, faodaidh clàran ceangail ceangal a dhèanamh àireamh sam bith de bhuidhnean (chan eil gu feum 2).

Tha an call obrach seo, aig a’ chiad sealladh, a’ toirt sùbailteachd mòr airson atharrachaidhean. Bidh an leithid de structar a 'fàs fulangach chan ann a-mhàin ri atharrachaidhean ann an càirdeas nan ceanglaichean a th' ann mar-thà, ach cuideachd ri feadhainn ùra a chur ris - ma tha ceangal aig suidheachadh seic ris an ionmhasair a bhris troimhe, bidh coltas a leithid de cheangal dìreach gu bhith na add-on thairis air clàran a tha ann mar-thà gun a bhith a’ toirt buaidh air nithean agus pròiseasan a tha ann mar-thà.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

2. Dàta dùblachadh

Chan eil an dàrna duilgheadas air fhuasgladh le ailtireachd sùbailte cho follaiseach agus tha e dualach sa chiad àite. Tomhais seòrsa SCD2 (mean air mhean ag atharrachadh tomhasan an dàrna seòrsa), ged nach eil iad a-mhàin.

Ann an taigh-bathair clasaigeach, mar as trice tha tomhas mar chlàr anns a bheil iuchair ionaid (mar PK) agus seata de iuchraichean gnìomhachais agus buadhan ann an colbhan fa leth.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Ma tha tomhas a’ toirt taic do dhreach, thèid crìochan dligheachd dreach a chur ris an t-seata àbhaisteach de raointean, agus nochdaidh grunn dhreachan anns an stòr airson aon sreath san stòr (aon airson gach atharrachadh ann am buadhan dreach).

Ma tha co-dhiù aon fheart dreach a tha ag atharrachadh gu tric ann an tomhas, bidh an àireamh de dhreachan den leithid de mheud drùidhteach (fiù mura h-eil na buadhan a tha air fhàgail air an tionndadh no nach atharraich iad), agus ma tha grunn bhuadhan mar sin ann, faodaidh an àireamh de dhreachan. fàs gu h-obann bhon àireamh aca. Faodaidh an tomhas seo tòrr rùm diosg a ghabhail, ged a tha mòran den dàta a bhios e a’ stòradh dìreach mar dhùblachadh de luachan feart so-ruigsinneach bho shreathan eile.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Aig an aon àm, tha e cuideachd air a chleachdadh gu math tric dì-mheadhanachadh - tha cuid de bhuadhan air an stòradh a dh’aona ghnothach mar luach, agus chan ann mar cheangal ri leabhar fiosrachaidh no taobh eile. Bidh an dòigh-obrach seo a’ luathachadh ruigsinneachd dàta, a’ lughdachadh na h-àireimh de cheangalaichean nuair a gheibhear cothrom air tomhas.

Mar as trice bidh seo a’ leantainn gu tha an aon fhiosrachadh air a stòradh aig an aon àm ann an grunn àiteachan. Mar eisimpleir, faodar fiosrachadh mun sgìre còmhnaidh agus roinn an neach-dèiligidh a stòradh aig an aon àm anns na tomhasan “Cliant” agus na fìrinnean “Ceannach”, “Lìbhrigeadh” agus “Call Center Call”, a bharrachd air anns an “Cliant - Manaidsear Cliant”. " clàr ceangail.

San fharsaingeachd, tha na tha air a mhìneachadh gu h-àrd a’ buntainn ri tomhasan cunbhalach (neo-dreach), ach ann an dreachan is dòcha gu bheil sgèile eadar-dhealaichte aca: tha nochdadh dreach ùr de nì (gu sònraichte le sùil air ais) a’ leantainn chan ann a-mhàin ri ùrachadh a h-uile càil co-cheangailte. clàran, ach gu coltas cascading dreachan ùra de nithean co-cheangailte - nuair a tha Clàr 1 air a chleachdadh airson Clàr 2 a thogail, agus Clàr 2 air a chleachdadh gus Clàr 3 a thogail, msaa. Fiù mura h-eil aon fheart de Chlàr 1 an sàs ann an togail Clàr 3 (agus tha buadhan eile ann an Clàr 2 a fhuaireadh bho thùsan eile an sàs), bheir dreach an togail seo aig a’ char as lugha gu cosgais a bharrachd, agus aig a’ char as àirde gu barrachd. tionndaidhean ann an Clàr 3. aig nach eil gnothach sam bith ris idir, agus nas fhaide sìos an t-sreath.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

3. Nonlinear iom-fhillteachd rework

Aig an aon àm, bidh gach aghaidh stòr ùr, a chaidh a thogail air bunait fear eile, ag àrdachadh an àireamh de dh'àiteachan far am faod dàta “eadar-dhealachadh” nuair a thèid atharrachaidhean a dhèanamh air an ETL. Bidh seo, an uair sin, a’ leantainn gu àrdachadh ann an iom-fhillteachd (agus fad) gach ath-sgrùdaidh às deidh sin.

Ma tha na tha gu h-àrd a 'toirt cunntas air siostaman le pròiseasan ETL nach eil air an atharrachadh gu tric, faodaidh tu a bhith beò ann an leithid de phàtran - feumaidh tu dèanamh cinnteach gu bheil atharrachaidhean ùra air an dèanamh gu ceart air a h-uile nì co-cheangailte. Ma thachras ath-sgrùdaidhean gu tric, tha an coltas gum bi grunn cheanglaichean “a dhìth” gun fhiosta a’ dol am meud gu mòr.

Ma bheir sinn a-steach cuideachd gu bheil “dreach” ETL gu math nas iom-fhillte na fear “neo-dreach”, bidh e gu math duilich mearachdan a sheachnadh nuair a bhios tu ag ùrachadh a’ ghoireas seo gu lèir gu tric.

A’ stòradh nithean agus buadhan ann am Modail Data Vault agus Anchor

Faodar an dòigh-obrach a mhol ùghdaran ailtireachd sùbailte a dhealbhadh mar a leanas:

Tha e riatanach na tha ag atharrachadh a sgaradh bho na tha air fhàgail mar a tha e. Is e sin, iuchraichean a stòradh air leth bho bhuadhan.

Ach, cha bu chòir aon a bhith troimh-chèile gun dreach feart le gun atharrachadh: chan eil a’ chiad fhear a’ stòradh eachdraidh nan atharrachaidhean aige, ach faodaidh e atharrachadh (mar eisimpleir, nuair a thathar a’ ceartachadh mearachd cuir a-steach no a’ faighinn dàta ùr); cha bhith an dàrna fear ag atharrachadh.

Tha beachdan eadar-dhealaichte air dè dìreach a dh'fhaodar a mheas nach gabh atharrachadh anns an Data Vault agus an Anchor Model.

Bho shealladh ailtireachd Stòr-dàta, faodar a mheas gun atharrachadh seata iomlan de iuchraichean - nàdarra (TIN na buidhne, còd toraidh san t-siostam stòr, msaa) agus ionaid. Anns a 'chùis seo, faodar na feartan a tha air fhàgail a roinn ann am buidhnean a rèir stòr agus / no tricead atharrachaidhean agus Cùm clàr fa leth airson gach buidheann le seata neo-eisimeileach de dhreachan.

Anns a 'phàtran Modail Anchor air a mheas gun atharrachadh dìreach iuchair ionaid brìgh. Tha a h-uile càil eile (a 'gabhail a-steach iuchraichean nàdarra) dìreach na chùis shònraichte de na feartan aige. anns a bheil tha na feartan uile neo-eisimeileach bho chèile gu bunaiteach, mar sin airson gach feart a bòrd air leth.

В Stòr-dàta canar clàran anns a bheil iuchraichean eintiteas Hubami. Bidh ionadan an-còmhnaidh a’ toirt a-steach seata raointean stèidhichte:

  • Iuchraichean eintiteas nàdurrach
  • Iuchrach ionaid
  • Ceangal gu stòr
  • Clàraich ùine cur-ris

Postan ann an Hubs na atharraich a-riamh agus chan eil dreach sam bith ann. Taobh a-muigh, tha mòr-ionadan glè choltach ri clàran seòrsa mapa ID a thathas a’ cleachdadh ann an cuid de shiostaman gus luchd-ionaid a ghineadh, ge-tà, thathas a’ moladh hash a chleachdadh bho sheata de iuchraichean gnìomhachais mar ionadan ann an Data Vault. Bidh an dòigh-obrach seo a’ sìmpleachadh dàimhean luchdachadh agus buadhan bho stòran (cha bhith feum air a dhol a-steach don mhòr-ionad gus neach-ionaid fhaighinn, dìreach obrachadh a-mach hash iuchair nàdarra), ach faodaidh e duilgheadasan eile adhbhrachadh (co-cheangailte, mar eisimpleir, ri tubaistean, cùis agus neo-chlò-bhuailte caractaran ann an iuchraichean sreang, msaa .p.), mar sin chan eilear a’ gabhail ris san fharsaingeachd.

Tha a h-uile feart eintiteas eile air a stòradh ann an clàran sònraichte ris an canar Satailitean. Faodaidh grunn saidealan a bhith aig aon ionad a’ stòradh sheata de bhuadhan eadar-dhealaichte.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Tha cuairteachadh buadhan am measg saidealan a’ tachairt a rèir a’ phrionnsapail co-atharrachadh - ann an aon saideal faodar buadhan neo-dhreach a stòradh (mar eisimpleir, ceann-latha breith agus SNILS airson neach fa-leth), ann an tè eile - dreach nach eil tric ag atharrachadh (mar eisimpleir, ainm mu dheireadh agus àireamh cead-siubhail), anns an treas fear - an fheadhainn a bhios ag atharrachadh gu tric (mar eisimpleir, seòladh lìbhrigidh, roinn, ceann-latha an òrduigh mu dheireadh, msaa). Anns a ’chùis seo, thathas a’ dèanamh dreach aig ìre saidealan fa leth, agus chan e an eintiteas gu h-iomlan, agus mar sin tha e ciallach buadhan a sgaoileadh gus nach bi an eadar-ghearradh de dhreachan taobh a-staigh aon saideal cho beag (a lughdaicheas an àireamh iomlan de dhreachan stòraichte ).

Cuideachd, gus am pròiseas luchdachadh dàta a bharrachadh, bidh buadhan a gheibhear bho dhiofar thùsan gu tric air an toirt a-steach do shaidealan fa leth.

Bidh saidealan a’ conaltradh ris an Hub tro iuchair chèin (a tha a 'freagairt ri 1-gu-mòran cardinality). Tha seo a’ ciallachadh gu bheil grunn luachan buadhan (mar eisimpleir, ioma àireamhan fòn conaltraidh airson aon neach-dèiligidh) a’ faighinn taic bhon ailtireachd “àbhaisteach” seo.

В Modail Anchor canar bùird ris a bheil iuchraichean stòraidh Acraichean. Agus tha iad a 'cumail:

  • Iuchraichean ionaid a-mhàin
  • Ceangal gu stòr
  • Clàraich ùine cur-ris

Thathas a’ beachdachadh air iuchraichean nàdurrach bho shealladh a’ Mhodail Anchor feartan àbhaisteach. Is dòcha gu bheil an roghainn seo nas duilghe a thuigsinn, ach tha e a’ toirt mòran a bharrachd cothrom airson an nì aithneachadh.

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Mar eisimpleir, ma thig dàta mun aon eintiteas bho dhiofar shiostaman, agus bidh gach fear dhiubh a’ cleachdadh an iuchair nàdarra fhèin. Ann an Data Vault, faodaidh seo leantainn gu structaran caran trom de ghrunn mhòr-ionadan (aon airson gach stòr + prìomh dhreach aonachaidh), agus ann am modal Anchor, tha iuchair nàdarra gach stòr a’ tuiteam a-steach don fheart aige fhèin agus faodar a chleachdadh nuair a thèid a luchdachadh gu neo-eisimeileach bho a h-uile duine eile.

Ach tha aon phuing brònach an seo cuideachd: ma tha buadhan bho dhiofar shiostaman air an cur còmhla ann an aon eintiteas, is coltaiche gu bheil cuid ann riaghailtean "gluing", leis am feum an siostam tuigsinn gu bheil clàran bho dhiofar thùsan a’ freagairt ri aon eisimpleir den eintiteas.

В Stòr-dàta is dòcha gum bi na riaghailtean sin a’ dearbhadh an cruthachadh “ionad ionaid” den phrìomh bhuidheann agus gun a bhith a’ toirt buaidh ann an dòigh sam bith air na Hubs a bhios a’ stòradh iuchraichean stòrais nàdarra agus na feartan tùsail aca. Ma dh’ atharraicheas na riaghailtean co-aonaidh aig àm air choreigin (no ma thèid na buadhan leis a bheil e air a choileanadh ùrachadh), bidh e gu leòr na mòr-ionadan ath-dhealbhadh.

В Modail anchor is coltaiche gun tèid an leithid de bhuidheann a stòradh an aon acair. Tha seo a’ ciallachadh gum bi a h-uile buadhan, ge bith dè an tùs às a thàinig iad, ceangailte ris an aon ionad. Faodaidh e a bhith mòran nas duilghe a bhith a 'sgaradh chlàran co-aonaichte gu mearachdach agus, san fharsaingeachd, a' cumail sùil air iomchaidheachd aonadh ann an siostam mar sin, gu h-àraid ma tha na riaghailtean gu math iom-fhillte agus ag atharrachadh gu tric, agus gheibhear an aon rud bho dhiofar thùsan (ged a tha e gu cinnteach). comasach, leis gu bheil ceangal aig gach dreach den bhuadh ris an stòr aige).

Ann an suidheachadh sam bith, ma tha còir aig an t-siostam agad an gnìomh a chuir an gnìomh dùblachadh, clàran a’ tighinn còmhla agus eileamaidean MDM eile, is fhiach aire shònraichte a thoirt do na taobhan de stòradh iuchraichean nàdarra ann am modhan lùthmhor. Tha e coltach gum bi an dealbhadh Data Vault nas motha gu h-obann nas sàbhailte a thaobh mhearachdan aonaidh.

Modail anchor cuideachd a’ toirt seachad seòrsa nì a bharrachd ris an canar Snaidhm tha e gu ìre sònraichte seòrsa de dh'acair ath-ghinealach, anns nach urrainn ach aon fheart a bhi ann. Bu chòir na nodan a bhith air an cleachdadh airson clàran còmhnard a stòradh (mar eisimpleir, gnè, inbhe pòsaidh, roinn seirbheis teachdaiche, msaa). Eu-coltach ris an Anchor, an snaidhm chan eil clàran feartan co-cheangailte ris, agus tha an aon fheart aige (ainm) an-còmhnaidh air a stòradh san aon chlàr leis an iuchair. Tha nodan ceangailte ri Anchors le bùird ceangail (Tie) san aon dòigh sa tha Anchors ceangailte ri chèile.

Chan eil beachd soilleir ann a thaobh cleachdadh Nodes. Mar eisimpleir, Nikolay Golov, a tha gu gnìomhach a’ brosnachadh cleachdadh Modail Anchor anns an Ruis, a’ creidsinn (chan ann gu mì-reusanta) nach urrainnear a ràdh le cinnt airson aon leabhar fiosrachaidh. an-còmhnaidh bidh e statach agus aon-ìre, agus mar sin tha e nas fheàrr Anchor làn-chuimseach a chleachdadh sa bhad airson a h-uile nì.

Is e eadar-dhealachadh cudromach eile eadar Data Vault agus modal Anchor na tha ri fhaighinn feartan nan ceanglaichean:

В Stòr-dàta Is e ceanglaichean na h-aon nithean làn-chuimseach ri Hubs, agus faodaidh iad a bhith feartan fhèin. Tha a ' Modail anchor Tha ceanglaichean air an cleachdadh a-mhàin airson ceangal Anchors agus chan urrainn na feartan aca fhèin a bhith aca. Tha an eadar-dhealachadh seo mar thoradh air modhan modaladh gu math eadar-dhealaichte fìrinnean, a thèid a dheasbad nas fhaide.

Stòradh fìrinn

Roimhe seo, bhruidhinn sinn gu sònraichte mu mhodaladh tomhais. Tha na fìrinnean beagan nas soilleire.

В Stòr-dàta Is e rud àbhaisteach airson fìrinnean a stòradh Ceangal, anns a bheil fìor chomharran saideal air an cur ris.

Tha an dòigh-obrach seo a’ coimhead intuitive. Tha e a’ toirt cothrom furasta air na comharran sgrùdaichte agus sa chumantas tha e coltach ri clàr fìrinn traidiseanta (chan eil ach na comharran air an stòradh chan ann sa chlàr fhèin, ach sa chlàr “nàbachd”). Ach tha duilgheadasan ann cuideachd: tha feum air aon de na h-atharrachaidhean àbhaisteach air a’ mhodail - leudachadh air an fhìrinn a’ cur iuchair chèin ùr ri Link. Agus tha seo, an uair sin, “a’ briseadh ”modularity agus dh’ fhaodadh e adhbhrachadh gu bheil feum air atharrachaidhean air nithean eile.

В Modail anchor Chan urrainn na buadhan aige fhèin a bhith aig ceangal, agus mar sin chan obraich an dòigh-obrach seo - feumaidh a h-uile buadhan agus comharran a bhith ceangailte ri aon acair sònraichte. Tha an co-dhùnadh bho seo sìmplidh - Feumaidh gach fìrinn cuideachd an acair fhèin. Airson cuid de na tha sinn cleachdte ri bhith a’ faicinn mar fhìrinnean, is dòcha gum bi seo a’ coimhead nàdarra - mar eisimpleir, faodar fìrinn ceannach a lughdachadh gu foirfe chun nì “òrdugh” no “cuidhteas”, tadhal air làrach gu seisean, msaa. Ach tha fìrinnean ann cuideachd airson nach eil e cho furasta a leithid de “stuth giùlain” nàdarra a lorg - mar eisimpleir, na tha air fhàgail de bhathar ann an taighean-bathair aig toiseach gach latha.

A rèir sin, chan èirich duilgheadasan le modularity nuair a leudaicheas tu iuchair fiosrachaidh ann am modal Anchor (tha e gu leòr dìreach Dàimh ùr a chuir ris an Anchor co-fhreagarrach), ach chan eil dealbhadh modail airson fìrinnean a thaisbeanadh cho soilleir; Faodaidh acraichean “fuadain” nochdadh a tha a’ taisbeanadh modal an nì gnìomhachais ann an dòigh neo-shoilleir.

Mar a gheibhear sùbailteachd

Tha an togail mar thoradh air an dà chùis a 'toirt a-steach mòran a bharrachd chlàranseach tomhas traidiseanta. Ach faodaidh e gabhail mòran nas lugha de dh 'àite diosg leis an aon sheata de bhuadhan dreach ris an taobh thraidiseanta. Gu nàdarra, chan eil draoidheachd an seo - tha e mu dheidhinn gnàthachadh. Le bhith a’ cuairteachadh buadhan thairis air saidealan (anns an Data Vault) no bùird fa leth (Modail Anchor), bidh sinn a’ lughdachadh (no a’ cuir às gu tur) dùblachadh luachan cuid de bhuadhan nuair a bhios iad ag atharrachadh cuid eile.

airson Stòr-dàta bidh na buannachdan an urra ri cuairteachadh bhuadhan am measg nan Satailteach, agus airson Modail anchor - cha mhòr gu dìreach a rèir an àireamh chuibheasach de dhreachan airson gach nì tomhais.

Ach, tha sàbhaladh àite na phrìomh bhuannachd, ach chan e am prìomh bhuannachd, airson buadhan a stòradh air leth. Còmhla ri stòradh fa leth dàimhean, dòigh-obrach seo a 'dèanamh an stòr dealbhadh modular. Tha seo a’ ciallachadh gu bheil coltas ann gu bheil cur ris an dà chuid buadhan fa leth agus raointean cuspaireil ùra gu lèir ann an leithid de mhodail àrd-structar thairis air seata de stuthan a tha ann mar-thà gun atharrachadh. Agus is e seo dìreach a tha a’ dèanamh na dòighean-obrach a tha air am mìneachadh sùbailte.

Tha seo cuideachd coltach ris a’ ghluasad bho chinneasachadh pìosan gu mòr-chinneasachadh - ma tha gach clàr den mhodail gun samhail anns an dòigh-obrach thraidiseanta agus feumach air aire shònraichte, an uairsin ann am modhan sùbailte tha e mar-thà na sheata de “phàirtean” àbhaisteach. Air an aon làimh, tha barrachd chlàran ann, agus bu chòir coimhead nas iom-fhillte air pròiseasan luchdachadh is faighinn air ais dàta. Air an làimh eile, bidh iad a 'fàs àbhaisteach. A tha a’ ciallachadh a dh’ fhaodadh a bhith ann fèin-ghluasadach agus meata-dàta air a stiùireadh. Tha a 'cheist "ciamar a chuireas sinn e?", am freagairt a dh'fhaodadh a bhith na phàirt chudromach den obair air dealbhadh leasachaidhean, a-nis chan fhiach e (a bharrachd air a' cheist mu bhuaidh atharrachadh a 'mhodail air pròiseasan obrach). ).

Chan eil seo a 'ciallachadh nach eil feum air sgrùdairean ann an leithid de shiostam idir - feumaidh cuideigin fhathast obrachadh tron ​​​​t-seata de nithean le buadhan agus faighinn a-mach càite agus ciamar a thèid a h-uile càil a luchdachadh. Ach tha an ìre obrach, a bharrachd air coltas agus cosgais mearachd, air a lughdachadh gu mòr. An dà chuid aig ìre anailis agus rè leasachadh ETL, a dh’ fhaodar gu ìre mhòr a lughdachadh gu deasachadh meata-dàta.

Taobh dorcha

Tha a h-uile rud gu h-àrd a’ dèanamh an dà dhòigh-obrach dha-rìribh sùbailte, adhartach gu teicneòlach agus freagarrach airson leasachadh ath-aithriseach. Gu dearbh, tha “baraille san ointment” ann cuideachd, agus tha mi a’ smaoineachadh as urrainn dhut tomhas mu thràth.

Tha lobhadh dàta, a tha mar bhunait air modularity ailtireachd sùbailte, a’ leantainn gu àrdachadh anns an àireamh de chlàran agus, a rèir sin, os an cionn a dhol còmhla nuair a thathar a’ samplachadh. Gus dìreach a h-uile buadhan meud fhaighinn, ann an stòr clasaigeach tha aon taghadh gu leòr, ach feumaidh ailtireachd sùbailte sreath slàn de cheangalaichean. A bharrachd air an sin, ma ghabhas iad sin uile a-steach airson aithisgean a sgrìobhadh ro-làimh, bidh luchd-anailis a tha cleachdte ri bhith a’ sgrìobhadh SQL le làimh a’ fulang dà uair.

Tha grunn fhìrinnean ann a nì an suidheachadh seo nas fhasa:

Nuair a bhios tu ag obair le tomhasan mòra, cha mhòr nach tèid na feartan aige a chleachdadh aig an aon àm. Tha seo a’ ciallachadh gum faodadh nas lugha de cheangalaichean a bhith ann na tha e coltach aig a’ chiad sealladh air a’ mhodail. Faodaidh Data Vault cuideachd aire a thoirt don tricead roinneadh ris a bheil dùil nuair a thathar a’ riarachadh buadhan do shaidealan. Aig an aon àm, tha feum air Mòr-ionadan no Acraichean fhèin gu sònraichte airson luchd-ionaid a ghineadh agus a mhapadh aig an ìre luchdachadh agus is ann ainneamh a thathas gan cleachdadh ann an ceistean (tha seo gu sònraichte fìor airson Anchors).

Tha a h-uile ceangal le iuchair. A bharrachd air an sin, tha dòigh nas “dùmhlaichte” airson dàta a stòradh a’ lughdachadh na tha de chlàran sganaidh far a bheil feum air (mar eisimpleir, nuair a thathar a’ sìoladh a rèir luach buadhach). Faodaidh seo leantainn gu bheil samplachadh bho stòr-dàta àbhaisteach le dòrlach de cheangalaichean eadhon nas luaithe na bhith a’ sganadh aon tomhas trom le mòran dhreachan gach sreath.

Mar eisimpleir, an seo ann an seo Anns an artaigil tha deuchainn coimeasach mionaideach air coileanadh modail Anchor le sampall bho aon chlàr.

Tha tòrr an urra ris an einnsean. Tha uidheamachdan optimization ballrachd a-staigh aig mòran de àrd-ùrlaran an latha an-diugh. Mar eisimpleir, faodaidh MS SQL agus Oracle “sgiob” a chuir ri bùird mura tèid an dàta aca a chleachdadh an àite sam bith ach a-mhàin ceanglaichean eile agus nach toir e buaidh air an taghadh deireannach (cuir às do bhòrd / ceangal), agus MPP Vertica eòlas co-obraichean bho Avito, air a bhith na einnsean sàr-mhath airson an Anchor Model, le beagan optimization làimhe den phlana ceist. Air an làimh eile, chan eil e coltach gur e fìor dheagh bheachd a th’ ann a bhith a’ stòradh am Modail Anchor, mar eisimpleir, air Click House, aig a bheil taic cho-cheangail cuibhrichte.

A bharrachd air an sin, airson an dà ailtireachd tha gluasadan sònraichte, a’ dèanamh ruigsinneachd dàta nas fhasa (an dà chuid bho shealladh dèanadais ceist agus airson luchd-cleachdaidh deireannach). Mar eisimpleir, Clàran puing-ann-ùine ann an Data Vault no gnìomhan bùird sònraichte ann am modail Anchor.

Iomlan

Is e prìomh adhbhar nan ailtirean sùbailte a tha air am meas modularity an “dealbhadh”.

Is e an t-seilbh seo a tha a 'ceadachadh:

  • Às deidh beagan ullachaidh tùsail co-cheangailte ri cleachdadh meata-dàta agus sgrìobhadh algorithms bunaiteach ETL, thoir a’ chiad toradh don neach-ceannach gu sgiobalta ann an cruth aithisg no dhà anns a bheil dàta bho dìreach beagan stuthan stòr. Chan fheumar smaoineachadh gu tur (eadhon aig an ìre as àirde) modal an nì gu lèir.
  • Faodaidh modal dàta tòiseachadh ag obair (agus a bhith feumail) le dìreach 2-3 nithean, agus an uairsin fàs mean air mhean (a thaobh modal Anchor Nikolai air a chur an sàs coimeas math ri mycelium).
  • A’ mhòr-chuid de leasachaidhean, a’ gabhail a-steach leudachadh air an raon cuspair agus cur ri tobraichean ùra chan eil e a’ toirt buaidh air gnìomhachd a tha ann mar-thà agus chan eil e na chunnart gun tèid rudeigin a bhriseadh a tha ag obair mar-thà.
  • Mar thoradh air lobhadh gu eileamaidean àbhaisteach, tha pròiseasan ETL ann an leithid de shiostaman a’ coimhead an aon rud, tha an sgrìobhadh aca iomchaidh airson algorithmization agus, aig a’ cheann thall, fèin-ghluasad.

Tha prìs an t-sùbailteachd seo coileanadh. Chan eil seo a 'ciallachadh gu bheil e do-dhèanta coileanadh iomchaidh a choileanadh air na modalan sin. Nas trice na chan e, is dòcha gu feum thu barrachd oidhirp agus aire gu mion-fhiosrachadh gus na meatrach a tha thu ag iarraidh a choileanadh.

apps

Seòrsan eintiteas Stòr-dàta

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Barrachd fiosrachaidh mu dheidhinn Data Vault:
Làrach-lìn Dan Lystadt
A h-uile mu data vault ann an ruisis
Mu dheidhinn Data Vault air Habré

Seòrsan eintiteas Modail Anchor

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Barrachd fiosrachaidh mu dheidhinn Modail Anchor:

Làrach-lìn luchd-cruthachaidh Anchor Model
Artaigil mun eòlas air buileachadh Anchor Model ann an Avito

Clàr geàrr-chunntas le feartan cumanta agus eadar-dhealachaidhean de na dòighean-obrach air an deach beachdachadh:

Sealladh farsaing air dòighean dealbhaidh Agile DWH

Source: www.habr.com

Cuir beachd ann