DATA VAULTти иштеп чыгуу жана BUSINES DATA VAULTке өтүү

Мурунку макалада мен DATA VAULTтин негиздери жөнүндө айтып бердим, DATA VAULTтин негизги элементтерин жана алардын максатын сүрөттөп бердим. Бул DATA VAULT темасы түгөнгөн деп эсептелбейт, DATA VAULT эволюциясынын кийинки кадамдары жөнүндө сөз кылуу керек.

Жана бул макалада мен DATA VAULTти өнүктүрүүгө жана BUSINESS DATA VAULT же жөн эле BUSINESS VAULTке өтүүгө басым жасайм.

BUSINESS DATA VAULT пайда болушунун себептери

Белгилей кетчү нерсе, DATA VAULT белгилүү бир күчтүү жактары бар болсо да, анын кемчиликтери да жок эмес. Бул кемчиликтердин бири аналитикалык суроолорду жазуудагы кыйынчылык. Сурамдарда JOINдердин олуттуу саны бар, код узун жана түйшүктүү. Ошондой эле, DATA VAULTке кирген маалыматтар эч кандай өзгөрүүгө дуушар болбойт, ошондуктан, бизнес көз карашынан алганда, DATA VAULT таза түрүндө абсолюттук мааниге ээ эмес.

Бул кемчиликтерди жоюу үчүн DATA VAULT методологиясы төмөнкүдөй элементтер менен кеңейтилген:

  • PIT (убакыт боюнча чекит) таблицалары;
  • BRIDGE үстөлдөрү;
  • АЛДЫН АЛА АНЫКТАЛГАН ТУУНУЛАР.

Келгиле, бул элементтердин максатын кененирээк карап көрөлү.

PIT үстөлдөрү

Адатта, бир ишкердик субъекти (HUB) ар кандай жаңылануу ылдамдыгы менен маалыматтарды камтышы мүмкүн, мисалы, эгерде биз адамды мүнөздөгөн маалыматтар жөнүндө сөз кылсак, телефон номери, дарек же электрондук почта тууралуу маалыматтын жаңыртуу ылдамдыгы жогору деп айта алабыз: толук аты-жөнү, паспорттук маалыматтар, үй-бүлөлүк абалы же жынысы.

Ошондуктан, спутниктерди аныктоодо, алардын жаңыртуу жыштыгын эске алуу керек. Бул эмне үчүн маанилүү?

Эгерде сиз атрибуттарды ар кандай жаңыртуу ылдамдыгы менен бир таблицада сактасаңыз, анда эң көп өзгөртүлгөн атрибут жаңыланган сайын таблицага сап кошууга туура келет. Натыйжада диск мейкиндигинин көбөйүшү жана суроону аткаруу убактысынын көбөйүшү.

Азыр биз спутниктерди жаңыртуу жыштыгы боюнча бөлүп, аларга маалыматтарды өз алдынча жүктөй алганыбыздан кийин, биз заманбап маалыматтарды ала алышыбыз керек. Жакшыраак, керексиз JOINдерди колдонбостон.

Мага түшүндүрүп берейин, мисалы, жаңылануу ылдамдыгы ар түрдүү болгон спутниктерден учурдагы (акыркы жаңыртылган датага ылайык) маалыматты алуу керек. Бул үчүн, сиз ЖОЖду гана жасабастан, максималдуу жаңыртуу датасын MAX (Жаңыртуу күнү) тандоо менен бир нече уяланган сурамдарды (маалымат камтыган ар бир спутник үчүн) түзүшүңүз керек. Ар бир жаңы JOIN менен мындай код өсөт жана абдан тез түшүнүү кыйын болуп калат.

PIT таблицасы мындай суроо-талаптарды жөнөкөйлөтүү үчүн иштелип чыккан; PIT таблицалары DATA VAULTге жаңы маалыматтарды жазуу менен бир убакта толтурулат. PIT таблицасы:

DATA VAULTти иштеп чыгуу жана BUSINES DATA VAULTке өтүү

Ошентип, биз убакыттын ар бир учурда бардык спутниктер үчүн маалыматтардын актуалдуулугу жөнүндө маалыматка ээ. PIT таблицасына JOINдерди колдонуу менен, биз PIT күн сайын жана боштуксуз толтурулган шартта, уяланган сурамдарды толугу менен жок кыла алабыз. МИТте боштуктар болсо дагы, актуалдуу маалыматтарды МИТтин өзүнө бир гана уяланган суроону колдонуу менен алууга болот. Ар бир спутникке уя салынган суроого караганда бир уяланган суроо тезирээк иштетилет.

BRIDGE

BRIDGE таблицалары аналитикалык сурамдарды жөнөкөйлөтүү үчүн да колдонулат. Бирок, PITтен айырмаланган нерсе - бул ар кандай хабтар, шилтемелер жана алардын спутниктеринин ортосундагы суроо-талаптарды жөнөкөйлөтүү жана тездетүү.

Таблица бардык спутниктерге керектүү бардык ачкычтарды камтыйт, алар көбүнчө сурамдарда колдонулат. Мындан тышкары, зарыл болгон учурда, талдоо үчүн ачкычтардын аталыштары керек болсо, хэштелген бизнес ачкычтары текст түрүндөгү ачкычтар менен толукталышы мүмкүн.

Чындыгында, BRIDGEди колдонбостон, ар кандай хабдарга тиешелүү спутниктерде жайгашкан маалыматтарды кабыл алуу процессинде спутниктердин өздөрүнө гана эмес, хабдарды бириктирген шилтемелерге да КОШУШУ керек болот.

BRIDGE бар же жок болушу сактагыч конфигурациясы жана суроону аткаруу ылдамдыгын оптималдаштыруу зарылчылыгы менен аныкталат. БРИГЕнин универсалдуу мисалын табуу кыйын.

АЛДЫН АЛА АНЫКТАЛГАН ТУУНУЛАР

Бизди БИЗНЕС МААЛЫМАТТАРЫНЫН СООСУна жакындаткан объекттин дагы бир түрү - бул алдын ала эсептелген көрсөткүчтөрдү камтыган таблицалар. Мындай таблицалар бизнес үчүн чындап маанилүү, алар берилген эрежелерге ылайык топтолгон маалыматты камтыйт жана аларга жетүүнү салыштырмалуу жеңилдетет.

Архитектуралык жактан АЛДЫН АЛА АНЫКТАЛГАН ТУУНУЛАР - бул белгилүү бир борбордун башка спутниги. Ал кадимки спутник сыяктуу эле бизнес ачкычын жана спутниктеги жазууну түзүү күнүн камтыйт. Окшоштуктар ушул жерде бүтөт, бирок. Мындай "адистештирилген" спутниктин атрибуттарынын андан аркы курамы бизнес колдонуучулар тарабынан эң популярдуу, алдын ала эсептелген көрсөткүчтөрдүн негизинде аныкталат.

Мисалы, кызматкер жөнүндө маалыматты камтыган хаб төмөнкүдөй индикаторлор менен спутникти камтышы мүмкүн:

  • минималдуу эмгек акы;
  • Максималдуу эмгек акы;
  • Орточо эмгек акы;
  • Чогултулган эмгек акынын жыйындысы ж.б.

Ошол эле борбордун PIT таблицасына АЛДЫН АЛА АНЫКТАЛГАН ТУУНУЛАРДЫ кошуу логикага ылайыктуу, анда сиз атайын тандалган дата боюнча кызматкер үчүн маалымат кесиндилерин оңой ала аласыз.

КОРУТУНДУ

Практика көрсөткөндөй, DATA VAULTти бизнес колдонуучулардын колдонуусу бир нече себептерден улам бир аз кыйынга турат:

  • Суроо коду татаал жана түйшүктүү;
  • JOINдердин көптүгү сурамдардын аткарылышына таасирин тийгизет;
  • Аналитикалык суроолорду жазуу сактоо дизайны боюнча мыкты билимди талап кылат.

Маалыматтарга жетүүнү жөнөкөйлөтүү үчүн DATA VAULT кошумча объектилер менен кеңейтилген:

  • PIT (убакыт боюнча чекит) таблицалары;
  • BRIDGE үстөлдөрү;
  • АЛДЫН АЛА АНЫКТАЛГАН ТУУНУЛАР.

Кийинки макала Мен BI менен иштешкендер үчүн, менин оюмча, эң кызыктуусун айтайын деп жатам. Мен DATA VAULT негизинде факты таблицаларын жана өлчөм таблицаларын түзүүнүн жолдорун көрсөтөм.

Макаланын материалдары төмөнкүлөргө негизделген:

  • боюнча чыгаруу Кента Грациано, деталдуу баяндоодон тышкары, моделдик диаграммаларды камтыйт;
  • Китеп: “DATA VAULT 2.0 менен масштабдуу маалымат кампасын куруу”;
  • макала Data Vault негиздери.

Source: www.habr.com

Комментарий кошуу