ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

నిల్వ సౌకర్యాన్ని అభివృద్ధి చేయడం సుదీర్ఘమైన మరియు తీవ్రమైన పని.

ప్రాజెక్ట్ యొక్క జీవితంలో చాలా వరకు ఆబ్జెక్ట్ మోడల్ మరియు బేస్ స్ట్రక్చర్ ప్రారంభంలో ఎంత బాగా ఆలోచించబడుతున్నాయి అనే దానిపై ఆధారపడి ఉంటుంది.

సాధారణంగా ఆమోదించబడిన విధానం స్టార్ స్కీమ్‌ను మూడవ సాధారణ రూపంతో కలపడానికి వివిధ రకాలుగా ఉంది మరియు అలాగే ఉంది. నియమం ప్రకారం, సూత్రం ప్రకారం: ప్రారంభ డేటా - 3NF, ప్రదర్శనలు - నక్షత్రం. ఈ విధానం, సమయం-పరీక్షించబడింది మరియు పెద్ద మొత్తంలో పరిశోధన ద్వారా మద్దతు ఇస్తుంది, విశ్లేషణాత్మక రిపోజిటరీ ఎలా ఉండాలనే దాని గురించి ఆలోచిస్తున్నప్పుడు అనుభవజ్ఞుడైన DWH నిపుణుడి మనస్సులో మొదటి (మరియు కొన్నిసార్లు ఏకైక) విషయం.

మరోవైపు, సాధారణంగా వ్యాపారం మరియు ముఖ్యంగా కస్టమర్ అవసరాలు త్వరగా మారతాయి మరియు డేటా "లోతు" మరియు "వెడల్పు" రెండింటిలోనూ పెరుగుతుంది. మరియు ఇక్కడే నక్షత్రం యొక్క ప్రధాన ప్రతికూలత కనిపిస్తుంది - పరిమితం వశ్యత.

మరియు అకస్మాత్తుగా DWH డెవలపర్‌గా మీ నిశ్శబ్ద మరియు హాయిగా ఉన్న జీవితంలో ఉంటే:

  • పని "కనీసం ఏదైనా త్వరగా చేయడానికి, ఆపై మేము చూస్తాము";
  • వేగంగా అభివృద్ధి చెందుతున్న ప్రాజెక్ట్ కనిపించింది, కొత్త మూలాల కనెక్షన్ మరియు కనీసం వారానికి ఒకసారి వ్యాపార నమూనా యొక్క పునర్నిర్మాణంతో;
  • సిస్టమ్ ఎలా ఉండాలో మరియు చివరికి అది ఏ విధులు నిర్వర్తించాలి అనే ఆలోచన లేని కస్టమర్ కనిపించాడు, కానీ ప్రయోగాలు చేయడానికి సిద్ధంగా ఉన్నాడు మరియు స్థిరంగా దానికి దగ్గరగా ఉన్నప్పుడు ఆశించిన ఫలితాన్ని స్థిరంగా మెరుగుపరచడానికి సిద్ధంగా ఉన్నాడు;
  • ప్రాజెక్ట్ మేనేజర్ శుభవార్తతో విరమించుకున్నారు: "మరియు ఇప్పుడు మనకు చురుకైనది!"

లేదా మీరు నిల్వ సౌకర్యాలను ఎలా నిర్మించవచ్చో తెలుసుకోవడానికి మీకు ఆసక్తి ఉంటే - కట్‌కు స్వాగతం!

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

"వశ్యత" అంటే ఏమిటి?

మొదట, సిస్టమ్ "ఫ్లెక్సిబుల్" అని పిలవడానికి ఏ లక్షణాలను కలిగి ఉండాలో నిర్వచిద్దాం.

విడిగా, వివరించిన లక్షణాలు ప్రత్యేకంగా సంబంధం కలిగి ఉండాలని పేర్కొనడం విలువ వ్యవస్థ, కాదు ప్రక్రియ దాని అభివృద్ధి. అందువల్ల, మీరు ఎజైల్ గురించి అభివృద్ధి పద్దతిగా చదవాలనుకుంటే, ఇతర కథనాలను చదవడం మంచిది. ఉదాహరణకు, అక్కడే, హబ్రేలో, చాలా ఆసక్తికరమైన పదార్థాలు ఉన్నాయి (వంటివి సమీక్ష и ఆచరణాత్మకమైనది, మరియు సమస్యాత్మకమైన).

అభివృద్ధి ప్రక్రియ మరియు డేటా గిడ్డంగి నిర్మాణం పూర్తిగా సంబంధం లేనివని దీని అర్థం కాదు. మొత్తంమీద, ఎజైల్ ఆర్కిటెక్చర్ కోసం ఎజైల్ రిపోజిటరీని అభివృద్ధి చేయడం చాలా సులభం. అయితే, ఆచరణలో, ఒక ప్రాజెక్ట్‌లో దాని రెండు రూపాల్లో వశ్యత యొక్క సంతోషకరమైన యాదృచ్ఛికత కంటే, జలపాతం ప్రకారం - కింబాల్ మరియు డేటావాల్ట్ ప్రకారం క్లాసిక్ DWH యొక్క చురుకైన అభివృద్ధితో తరచుగా ఎంపికలు ఉన్నాయి.

కాబట్టి, సౌకర్యవంతమైన నిల్వ ఏ సామర్థ్యాలను కలిగి ఉండాలి? ఇక్కడ మూడు పాయింట్లు ఉన్నాయి:

  1. ప్రారంభ డెలివరీ మరియు వేగవంతమైన మలుపు - దీనర్థం ఆదర్శవంతంగా మొదటి వ్యాపార ఫలితం (ఉదాహరణకు, మొదటి పని నివేదికలు) వీలైనంత త్వరగా పొందాలి, అంటే, మొత్తం సిస్టమ్ పూర్తిగా రూపకల్పన చేయబడి మరియు అమలు చేయబడటానికి ముందే. అంతేకాకుండా, ప్రతి తదుపరి పునర్విమర్శకు కూడా వీలైనంత తక్కువ సమయం పట్టాలి.
  2. పునరావృత శుద్ధీకరణ - దీని అర్థం ప్రతి తదుపరి మెరుగుదల ఇప్పటికే పని చేస్తున్న కార్యాచరణను ఆదర్శంగా ప్రభావితం చేయకూడదు. ఈ క్షణం పెద్ద ప్రాజెక్ట్‌లలో తరచుగా పెద్ద పీడకలగా మారుతుంది - ముందుగానే లేదా తరువాత, వ్యక్తిగత వస్తువులు చాలా కనెక్షన్‌లను పొందడం ప్రారంభిస్తాయి, ఇప్పటికే ఉన్న టేబుల్‌కి ఫీల్డ్‌ను జోడించడం కంటే సమీపంలోని కాపీలో లాజిక్‌ను పూర్తిగా పునరావృతం చేయడం సులభం అవుతుంది. ఇప్పటికే ఉన్న వస్తువులపై మెరుగుదలల ప్రభావాన్ని విశ్లేషించడానికి మెరుగుదలల కంటే ఎక్కువ సమయం పట్టవచ్చని మీరు ఆశ్చర్యపోతే, మీరు బ్యాంకింగ్ లేదా టెలికాంలలో పెద్ద డేటా గిడ్డంగులతో ఇంకా పని చేయలేదు.
  3. మారుతున్న వ్యాపార అవసరాలకు నిరంతరం అనుగుణంగా ఉంటుంది - మొత్తం వస్తువు నిర్మాణం సాధ్యమయ్యే విస్తరణను పరిగణనలోకి తీసుకోకుండా రూపొందించబడాలి, కానీ ఈ తదుపరి విస్తరణ యొక్క దిశను డిజైన్ దశలో కూడా కలలుకంటున్నది కాదు.

అవును, ఈ అవసరాలన్నింటినీ ఒకే సిస్టమ్‌లో తీర్చడం సాధ్యమవుతుంది (వాస్తవానికి, కొన్ని సందర్భాల్లో మరియు కొన్ని రిజర్వేషన్‌లతో).

క్రింద నేను డేటా గిడ్డంగుల కోసం అత్యంత ప్రజాదరణ పొందిన రెండు చురుకైన డిజైన్ పద్ధతులను పరిశీలిస్తాను - యాంకర్ మోడల్ и డేటా వాల్ట్. బ్రాకెట్లలో వదిలివేయడం వంటి అద్భుతమైన పద్ధతులు ఉన్నాయి, ఉదాహరణకు, EAV, 6NF (దాని స్వచ్ఛమైన రూపంలో) మరియు NoSQL సొల్యూషన్‌లకు సంబంధించిన ప్రతిదీ - అవి ఏదో ఒకవిధంగా అధ్వాన్నంగా ఉన్నందున కాదు మరియు ఈ సందర్భంలో కథనాన్ని కొనుగోలు చేయడానికి బెదిరిస్తుంది కాబట్టి కాదు. సగటు డిస్సర్ యొక్క వాల్యూమ్. మీ ప్రాజెక్ట్ యొక్క మొత్తం నిర్మాణం (EAV వంటివి) లేదా ప్రపంచవ్యాప్తంగా ఇతర సమాచార నిల్వ నమూనాలు (గ్రాఫ్ డేటాబేస్‌లు వంటివి)తో సంబంధం లేకుండా, మీరు నిర్దిష్ట సందర్భాలలో ఉపయోగించగల సాంకేతికతలకు - ఇవన్నీ కొంచెం భిన్నమైన తరగతికి సంబంధించిన పరిష్కారాలకు సంబంధించినవి. మరియు ఇతర ఎంపికలు NoSQL).

"క్లాసికల్" విధానం యొక్క సమస్యలు మరియు సౌకర్యవంతమైన పద్ధతుల్లో వాటి పరిష్కారాలు

"క్లాసికల్" విధానం ద్వారా నా ఉద్దేశ్యం మంచి పాత నక్షత్రం (అంతర్లీన లేయర్‌ల నిర్దిష్ట అమలుతో సంబంధం లేకుండా, కింబాల్, ఇన్‌మోన్ మరియు CDM అనుచరులు నన్ను క్షమించగలరు).

1. కనెక్షన్ల దృఢమైన కార్డినాలిటీ

ఈ మోడల్ డేటా యొక్క స్పష్టమైన విభజనపై ఆధారపడి ఉంటుంది డైమెన్షన్ и వాస్తవాలు. మరియు ఇది తార్కికం - అన్నింటికంటే, అధిక సంఖ్యలో కేసులలో డేటా విశ్లేషణ కొన్ని విభాగాలలో (కొలతలు) కొన్ని సంఖ్యా సూచికల (వాస్తవాలు) విశ్లేషణకు వస్తుంది.

ఈ సందర్భంలో, వస్తువుల మధ్య కనెక్షన్లు విదేశీ కీని ఉపయోగించి పట్టికల మధ్య సంబంధాల రూపంలో ఏర్పాటు చేయబడతాయి. ఇది చాలా సహజంగా కనిపిస్తుంది, కానీ వెంటనే వశ్యత యొక్క మొదటి పరిమితికి దారితీస్తుంది - కనెక్షన్ల కార్డినాలిటీ యొక్క ఖచ్చితమైన నిర్వచనం.

దీనర్థం టేబుల్ రూపకల్పన దశలో, మీరు ప్రతి జత సంబంధిత వస్తువులు అనేక నుండి చాలా వరకు లేదా 1 నుండి చాలా వరకు మాత్రమే మరియు "ఏ దిశలో" సంబంధం కలిగి ఉండవచ్చో ఖచ్చితంగా నిర్ణయించాలి. ఇది ఏ పట్టికలో ప్రాథమిక కీని కలిగి ఉందో మరియు ఏది విదేశీ కీని కలిగి ఉంటుందో నేరుగా నిర్ణయిస్తుంది. కొత్త అవసరాలు వచ్చినప్పుడు ఈ వైఖరిని మార్చడం అనేది బేస్ యొక్క పునర్నిర్మాణానికి దారి తీస్తుంది.

ఉదాహరణకు, "నగదు రసీదు" వస్తువును రూపకల్పన చేసేటప్పుడు, మీరు, సేల్స్ డిపార్ట్‌మెంట్ ప్రమాణాలపై ఆధారపడి, చర్య యొక్క అవకాశాన్ని నిర్దేశించారు. అనేక చెక్ స్థానాలకు ఒక ప్రమోషన్ (కానీ వైస్ వెర్సా కాదు):

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం
మరియు కొంత సమయం తరువాత, సహోద్యోగులు కొత్త మార్కెటింగ్ వ్యూహాన్ని ప్రవేశపెట్టారు, దీనిలో వారు అదే స్థితిలో పని చేయవచ్చు ఒకే సమయంలో అనేక ప్రమోషన్లు. మరియు ఇప్పుడు మీరు సంబంధాన్ని ప్రత్యేక వస్తువుగా విభజించడం ద్వారా పట్టికలను సవరించాలి.

(ప్రమోషన్ చెక్‌లో చేరిన అన్ని ఉత్పన్నమైన వస్తువులు ఇప్పుడు మెరుగుపరచబడాలి).

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం
డేటా వాల్ట్ మరియు యాంకర్ మోడల్‌లో సంబంధాలు

ఈ పరిస్థితిని నివారించడం చాలా సులభం: దీన్ని చేయడానికి మీరు అమ్మకాల విభాగాన్ని విశ్వసించాల్సిన అవసరం లేదు. అన్ని కనెక్షన్లు మొదట ప్రత్యేక పట్టికలలో నిల్వ చేయబడతాయి మరియు దానిని అనేక నుండి అనేకంగా ప్రాసెస్ చేయండి.

ఈ విధానాన్ని ప్రతిపాదించారు డాన్ లిన్‌స్టెడ్ నమూనాలో భాగంగా డేటా వాల్ట్ మరియు పూర్తిగా మద్దతు లార్స్ రోన్‌బాక్ в యాంకర్ మోడల్.

ఫలితంగా, మేము సౌకర్యవంతమైన పద్ధతుల యొక్క మొదటి విలక్షణమైన లక్షణాన్ని పొందుతాము:

వస్తువుల మధ్య సంబంధాలు పేరెంట్ ఎంటిటీల లక్షణాలలో నిల్వ చేయబడవు, కానీ అవి ఒక ప్రత్యేక రకం వస్తువు.

В డేటా వాల్ట్ అటువంటి లింకింగ్ టేబుల్స్ అంటారు <span style="font-family: Mandali; "> లింక్</span>, మరియు లో యాంకర్ మోడల్ - టై. మొదటి చూపులో, అవి చాలా పోలి ఉంటాయి, అయినప్పటికీ వారి తేడాలు పేరుతో ముగియవు (ఇది క్రింద చర్చించబడుతుంది). రెండు నిర్మాణాలలో, లింక్ పట్టికలు లింక్ చేయగలవు ఎన్ని ఎంటిటీలు అయినా (తప్పనిసరిగా 2 కాదు).

ఈ రిడెండెన్సీ, మొదటి చూపులో, మార్పులకు గణనీయమైన సౌలభ్యాన్ని అందిస్తుంది. అటువంటి నిర్మాణం ఇప్పటికే ఉన్న లింక్‌ల యొక్క కార్డినాలిటీలో మార్పులకు మాత్రమే కాకుండా, కొత్త వాటి జోడింపుకు కూడా సహనంతో ఉంటుంది - ఇప్పుడు చెక్ పొజిషన్‌లో దానిని విచ్ఛిన్నం చేసిన క్యాషియర్‌కు లింక్ కూడా ఉంటే, అటువంటి లింక్ యొక్క రూపాన్ని కేవలం ఇప్పటికే ఉన్న ఏ వస్తువులు మరియు ప్రక్రియలను ప్రభావితం చేయకుండా ఇప్పటికే ఉన్న పట్టికలపై యాడ్-ఆన్ అవ్వండి.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

2. డేటా డూప్లికేషన్

సౌకర్యవంతమైన నిర్మాణాల ద్వారా పరిష్కరించబడిన రెండవ సమస్య తక్కువ స్పష్టంగా ఉంటుంది మరియు మొదటి స్థానంలో అంతర్లీనంగా ఉంటుంది. SCD2 రకం కొలతలు (రెండవ రకం యొక్క కొలతలు నెమ్మదిగా మారుతున్నాయి), అయినప్పటికీ అవి మాత్రమే కాదు.

క్లాసిక్ వేర్‌హౌస్‌లో, డైమెన్షన్ అనేది సాధారణంగా సర్రోగేట్ కీ (PK వలె) మరియు ప్రత్యేక నిలువు వరుసలలోని వ్యాపార కీలు మరియు లక్షణాల సమితిని కలిగి ఉండే పట్టిక.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

డైమెన్షన్ సంస్కరణకు మద్దతిస్తుంటే, ప్రామాణిక ఫీల్డ్‌ల సెట్‌కు వెర్షన్ చెల్లుబాటు సరిహద్దులు జోడించబడతాయి మరియు మూలంలోని ఒక అడ్డు వరుస కోసం అనేక వెర్షన్‌లు రిపోజిటరీలో కనిపిస్తాయి (వెర్షన్డ్ అట్రిబ్యూట్‌లలో ప్రతి మార్పుకు ఒకటి).

డైమెన్షన్‌లో కనీసం ఒక తరచుగా మారుతున్న సంస్కరణ లక్షణాన్ని కలిగి ఉన్నట్లయితే, అటువంటి పరిమాణం యొక్క సంస్కరణల సంఖ్య ఆకట్టుకుంటుంది (మిగిలిన అట్రిబ్యూట్‌లు వెర్షన్ చేయకపోయినా లేదా ఎప్పటికీ మారకపోయినా), మరియు అలాంటి అనేక లక్షణాలు ఉంటే, సంస్కరణల సంఖ్య వారి సంఖ్య నుండి విపరీతంగా పెరుగుతాయి. ఈ పరిమాణం గణనీయమైన మొత్తంలో డిస్క్ స్థలాన్ని ఆక్రమించగలదు, అయినప్పటికీ ఇది నిల్వ చేసే డేటాలో ఎక్కువ భాగం ఇతర అడ్డు వరుసల నుండి మార్పులేని గుణ విలువల యొక్క నకిలీలు.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

అదే సమయంలో, ఇది చాలా తరచుగా ఉపయోగించబడుతుంది సాధారణీకరణ — కొన్ని లక్షణాలు ఉద్దేశపూర్వకంగా ఒక విలువగా నిల్వ చేయబడతాయి మరియు సూచన పుస్తకానికి లేదా మరొక కోణానికి లింక్‌గా కాదు. ఈ విధానం డేటా యాక్సెస్‌ని వేగవంతం చేస్తుంది, డైమెన్షన్‌ను యాక్సెస్ చేసేటప్పుడు చేరే సంఖ్యను తగ్గిస్తుంది.

సాధారణంగా ఇది దారితీస్తుంది అదే సమాచారం అనేక ప్రదేశాలలో ఏకకాలంలో నిల్వ చేయబడుతుంది. ఉదాహరణకు, నివాస ప్రాంతం మరియు క్లయింట్ యొక్క వర్గం గురించిన సమాచారాన్ని ఏకకాలంలో “క్లయింట్” కొలతలు మరియు “కొనుగోలు”, “డెలివరీ” మరియు “కాల్ సెంటర్ కాల్స్” వాస్తవాలలో అలాగే “క్లయింట్ - క్లయింట్ మేనేజర్”లో నిల్వ చేయవచ్చు. ” లింక్ టేబుల్.

సాధారణంగా, పైన వివరించినవి సాధారణ (నాన్-వెర్షన్డ్) కొలతలకు వర్తిస్తుంది, కానీ సంస్కరణలో అవి వేరే స్థాయిని కలిగి ఉండవచ్చు: వస్తువు యొక్క కొత్త వెర్షన్ (ముఖ్యంగా పునరాలోచనలో) కనిపించడం అన్ని సంబంధిత నవీకరణలకు మాత్రమే కాకుండా. పట్టికలు, కానీ సంబంధిత వస్తువుల యొక్క కొత్త సంస్కరణల యొక్క క్యాస్కేడింగ్ రూపానికి - టేబుల్ 1ని నిర్మించడానికి టేబుల్ 2 ఉపయోగించినప్పుడు మరియు టేబుల్ 2ని నిర్మించడానికి టేబుల్ 3 ఉపయోగించినప్పుడు, మొదలైనవి. టేబుల్ 1 యొక్క ఒక్క లక్షణం కూడా టేబుల్ 3 నిర్మాణంలో పాల్గొనకపోయినా (మరియు ఇతర మూలాల నుండి పొందిన టేబుల్ 2 యొక్క ఇతర లక్షణాలు ప్రమేయం కలిగి ఉంటాయి), ఈ నిర్మాణాన్ని సంస్కరణ చేయడం వలన కనీసం అదనపు ఓవర్‌హెడ్‌కు దారి తీస్తుంది మరియు గరిష్టంగా అదనపు పట్టిక 3లోని సంస్కరణలు. దీనితో ఎటువంటి సంబంధం లేదు మరియు గొలుసులో మరింత దిగువన ఉంది.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

3. రీవర్క్ యొక్క నాన్ లీనియర్ సంక్లిష్టత

అదే సమయంలో, ప్రతి కొత్త స్టోర్ ఫ్రంట్ మరొకదాని ఆధారంగా నిర్మించబడి, ETLకి మార్పులు చేసినప్పుడు డేటా "విభజించగల" స్థలాల సంఖ్యను పెంచుతుంది. ఇది, ప్రతి తదుపరి పునర్విమర్శ యొక్క సంక్లిష్టత (మరియు వ్యవధి) పెరుగుదలకు దారితీస్తుంది.

పైన పేర్కొన్నవి చాలా అరుదుగా సవరించబడిన ETL ప్రక్రియలతో సిస్టమ్‌లను వివరిస్తే, మీరు అలాంటి నమూనాలో జీవించవచ్చు - మీరు అన్ని సంబంధిత వస్తువులకు కొత్త మార్పులు సరిగ్గా ఉన్నాయని నిర్ధారించుకోవాలి. పునర్విమర్శలు తరచుగా జరిగితే, అనుకోకుండా అనేక కనెక్షన్లు "తప్పిపోయిన" సంభావ్యత గణనీయంగా పెరుగుతుంది.

అదనంగా, "వెర్షన్ చేయబడిన" ETL "నాన్-వెర్షన్" కంటే చాలా క్లిష్టంగా ఉందని మేము పరిగణనలోకి తీసుకుంటే, ఈ మొత్తం సదుపాయాన్ని తరచుగా అప్‌డేట్ చేస్తున్నప్పుడు తప్పులను నివారించడం చాలా కష్టమవుతుంది.

డేటా వాల్ట్ మరియు యాంకర్ మోడల్‌లో వస్తువులు మరియు లక్షణాలను నిల్వ చేయడం

ఫ్లెక్సిబుల్ ఆర్కిటెక్చర్ల రచయితలు ప్రతిపాదించిన విధానాన్ని ఈ క్రింది విధంగా రూపొందించవచ్చు:

మారుతున్న వాటి నుండి అదే విధంగా ఉండే వాటిని వేరు చేయడం అవసరం. అంటే, లక్షణాల నుండి విడిగా కీలను నిల్వ చేయండి.

అయితే, ఒకరు గందరగోళానికి గురికాకూడదు వెర్షన్ చేయలేదు తో లక్షణం మారలేదు: మొదటిది దాని మార్పుల చరిత్రను నిల్వ చేయదు, కానీ మార్చవచ్చు (ఉదాహరణకు, ఇన్‌పుట్ లోపాన్ని సరిచేసేటప్పుడు లేదా కొత్త డేటాను స్వీకరించేటప్పుడు); రెండవది ఎప్పటికీ మారదు.

డేటా వాల్ట్ మరియు యాంకర్ మోడల్‌లో మార్పులేనిదిగా పరిగణించబడే వాటిపై అభిప్రాయాలు భిన్నంగా ఉంటాయి.

నిర్మాణ కోణం నుండి డేటా వాల్ట్, మారకుండా పరిగణించవచ్చు కీల మొత్తం సెట్ - సహజ (సంస్థ యొక్క TIN, సోర్స్ సిస్టమ్‌లోని ఉత్పత్తి కోడ్ మొదలైనవి) మరియు సర్రోగేట్. ఈ సందర్భంలో, మిగిలిన లక్షణాలను మూలం మరియు/లేదా మార్పుల తరచుదనం ప్రకారం సమూహాలుగా విభజించవచ్చు మరియు ప్రతి సమూహానికి ప్రత్యేక పట్టికను నిర్వహించండి స్వతంత్ర సంస్కరణల సెట్‌తో.

పరమార్థంలో యాంకర్ మోడల్ మారకుండా పరిగణించబడుతుంది సర్రోగేట్ కీ మాత్రమే సారాంశం. మిగతావన్నీ (సహజ కీలతో సహా) దాని లక్షణాల యొక్క ప్రత్యేక సందర్భం. ఇందులో అన్ని గుణాలు డిఫాల్ట్‌గా ఒకదానికొకటి స్వతంత్రంగా ఉంటాయి, కాబట్టి ప్రతి లక్షణానికి a ప్రత్యేక పట్టిక.

В డేటా వాల్ట్ ఎంటిటీ కీలను కలిగి ఉన్న పట్టికలు అంటారు హుబామి. హబ్‌లు ఎల్లప్పుడూ స్థిరమైన ఫీల్డ్‌లను కలిగి ఉంటాయి:

  • సహజ ఎంటిటీ కీలు
  • సర్రోగేట్ కీ
  • మూలానికి లింక్
  • జోడించే సమయాన్ని రికార్డ్ చేయండి

హబ్‌లలో పోస్ట్‌లు ఎప్పుడూ మారదు మరియు సంస్కరణలు లేవు. బాహ్యంగా, హబ్‌లు సర్రోగేట్‌లను రూపొందించడానికి కొన్ని సిస్టమ్‌లలో ఉపయోగించే ID-మ్యాప్ టైప్ టేబుల్‌లకు చాలా పోలి ఉంటాయి, అయినప్పటికీ, డేటా వాల్ట్‌లో వ్యాపార కీల సెట్ నుండి హాష్‌ని సర్రోగేట్‌లుగా ఉపయోగించమని సిఫార్సు చేయబడింది. ఈ విధానం మూలాధారాల నుండి సంబంధాలు మరియు లక్షణాలను లోడ్ చేయడాన్ని సులభతరం చేస్తుంది (సర్రోగేట్ పొందడానికి మీరు హబ్‌లో చేరాల్సిన అవసరం లేదు, మీరు సహజ కీ యొక్క హాష్‌ను లెక్కించాలి), కానీ ఇతర సమస్యలను (ఉదాహరణకు, ఘర్షణలకు సంబంధించినది) కలిగిస్తుంది , కేస్ మరియు స్ట్రింగ్ కీలలో ముద్రించలేని అక్షరాలు మొదలైనవి. .p.), కాబట్టి ఇది సాధారణంగా ఆమోదించబడదు.

అన్ని ఇతర ఎంటిటీ అట్రిబ్యూట్‌లు అనే ప్రత్యేక పట్టికలలో నిల్వ చేయబడతాయి ఉపగ్రహాలు. ఒక హబ్‌లో అనేక ఉపగ్రహాలు వివిధ రకాల లక్షణాలను నిల్వ చేయగలవు.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

ఉపగ్రహాల మధ్య లక్షణాల పంపిణీ సూత్రం ప్రకారం జరుగుతుంది ఉమ్మడి మార్పు — ఒక శాటిలైట్‌లో నాన్-వెర్షన్డ్ అట్రిబ్యూట్‌లను నిల్వ చేయవచ్చు (ఉదాహరణకు, ఒక వ్యక్తికి పుట్టిన తేదీ మరియు SNILS), మరొకదానిలో - అరుదుగా మారుతున్న సంస్కరణలు (ఉదాహరణకు, చివరి పేరు మరియు పాస్‌పోర్ట్ నంబర్), మూడవది - తరచుగా మారుతున్న వాటిని (ఉదాహరణకు, డెలివరీ చిరునామా, వర్గం, చివరి ఆర్డర్ తేదీ మొదలైనవి). ఈ సందర్భంలో, సంస్కరణ అనేది వ్యక్తిగత ఉపగ్రహాల స్థాయిలో నిర్వహించబడుతుంది మరియు మొత్తం ఎంటిటీ కాదు, కాబట్టి ఒక ఉపగ్రహంలోని సంస్కరణల ఖండన తక్కువగా ఉండేలా లక్షణాలను పంపిణీ చేయడం మంచిది (ఇది నిల్వ చేసిన సంస్కరణల మొత్తం సంఖ్యను తగ్గిస్తుంది. )

అలాగే, డేటా లోడింగ్ ప్రక్రియను ఆప్టిమైజ్ చేయడానికి, వివిధ మూలాల నుండి పొందిన గుణాలు తరచుగా వ్యక్తిగత ఉపగ్రహాలలో చేర్చబడతాయి.

ఉపగ్రహాలు హబ్‌తో కమ్యూనికేట్ చేస్తాయి విదేశీ కీ (ఇది 1 నుండి అనేక కార్డినాలిటీకి అనుగుణంగా ఉంటుంది). ఈ “డిఫాల్ట్” ఆర్కిటెక్చర్ ద్వారా బహుళ అట్రిబ్యూట్ విలువలు (ఉదాహరణకు, ఒక క్లయింట్ కోసం బహుళ సంప్రదింపు ఫోన్ నంబర్‌లు) మద్దతు ఇస్తాయని దీని అర్థం.

В యాంకర్ మోడల్ కీలను నిల్వ చేసే పట్టికలు అంటారు యాంకర్లు. మరియు వారు ఉంచుతారు:

  • సర్రోగేట్ కీలు మాత్రమే
  • మూలానికి లింక్
  • జోడించే సమయాన్ని రికార్డ్ చేయండి

యాంకర్ మోడల్ యొక్క కోణం నుండి సహజ కీలు పరిగణించబడతాయి సాధారణ లక్షణాలు. ఈ ఐచ్ఛికం అర్థం చేసుకోవడం చాలా కష్టంగా అనిపించవచ్చు, కానీ ఇది వస్తువును గుర్తించడానికి మరింత స్కోప్ ఇస్తుంది.

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

ఉదాహరణకు, ఒకే ఎంటిటీకి సంబంధించిన డేటా వేర్వేరు సిస్టమ్‌ల నుండి రాగలిగితే, ప్రతి దాని స్వంత సహజ కీని ఉపయోగిస్తుంది. డేటా వాల్ట్‌లో, ఇది అనేక హబ్‌ల (మూలానికి ఒకటి + ఏకీకృత మాస్టర్ వెర్షన్) యొక్క గజిబిజి నిర్మాణాలకు దారి తీస్తుంది, అయితే యాంకర్ మోడల్‌లో, ప్రతి మూలం యొక్క సహజ కీ దాని స్వంత లక్షణంలోకి వస్తుంది మరియు స్వతంత్రంగా లోడ్ అవుతున్నప్పుడు ఉపయోగించవచ్చు. అన్ని ఇతరులు.

కానీ ఇక్కడ ఒక కృత్రిమ అంశం కూడా ఉంది: వివిధ సిస్టమ్‌ల నుండి గుణాలు ఒక ఎంటిటీలో కలిపి ఉంటే, చాలా మటుకు కొన్ని ఉన్నాయి "గ్లూయింగ్" నియమాలు, దీని ద్వారా వివిధ మూలాల నుండి రికార్డులు ఎంటిటీ యొక్క ఒక ఉదాహరణకి అనుగుణంగా ఉన్నాయని సిస్టమ్ అర్థం చేసుకోవాలి.

В డేటా వాల్ట్ ఈ నియమాలు చాలా మటుకు ఏర్పాటును నిర్ణయిస్తాయి మాస్టర్ ఎంటిటీ యొక్క "సర్రోగేట్ హబ్" మరియు సహజ సోర్స్ కీలు మరియు వాటి అసలు లక్షణాలను నిల్వ చేసే హబ్‌లను ఏ విధంగానూ ప్రభావితం చేయదు. ఏదో ఒక సమయంలో విలీన నియమాలు మారితే (లేదా అది నిర్వహించబడే గుణాలు నవీకరించబడినవి), సర్రోగేట్ హబ్‌లను రీఫార్మాట్ చేయడానికి సరిపోతుంది.

В యాంకర్ మోడల్ అటువంటి ఎంటిటీ ఎక్కువగా నిల్వ చేయబడుతుంది ఏకైక యాంకర్. దీనర్థం, అన్ని లక్షణాలు, అవి ఏ మూలం నుండి వచ్చినప్పటికీ, అదే సర్రోగేట్‌కు కట్టుబడి ఉంటాయి. తప్పుగా విలీనం చేయబడిన రికార్డులను వేరు చేయడం మరియు సాధారణంగా, అటువంటి వ్యవస్థలో విలీనం యొక్క ఔచిత్యాన్ని పర్యవేక్షించడం చాలా కష్టంగా ఉంటుంది, ప్రత్యేకించి నియమాలు చాలా క్లిష్టంగా మరియు తరచుగా మారుతూ ఉంటే మరియు అదే లక్షణాన్ని వివిధ మూలాల నుండి పొందవచ్చు (ఇది ఖచ్చితంగా ఉంది సాధ్యం, ఎందుకంటే ప్రతి లక్షణం వెర్షన్ దాని మూలానికి లింక్‌ను కలిగి ఉంటుంది).

ఏదైనా సందర్భంలో, మీ సిస్టమ్ కార్యాచరణను అమలు చేయవలసి ఉంటే తగ్గింపు, రికార్డులను విలీనం చేయడం మరియు ఇతర MDM అంశాలు, చురుకైన పద్దతులలో సహజ కీలను నిల్వ చేసే అంశాలకు ప్రత్యేక శ్రద్ధ పెట్టడం విలువ. విలీన లోపాల పరంగా స్థూలమైన డేటా వాల్ట్ డిజైన్ అకస్మాత్తుగా సురక్షితంగా ఉండే అవకాశం ఉంది.

యాంకర్ మోడల్ అనే అదనపు ఆబ్జెక్ట్ రకాన్ని కూడా అందిస్తుంది ముడి ఇది ముఖ్యంగా ప్రత్యేకమైనది యాంకర్ యొక్క క్షీణించిన రకం, ఇది ఒక లక్షణాన్ని మాత్రమే కలిగి ఉంటుంది. నోడ్‌లు ఫ్లాట్ డైరెక్టరీలను నిల్వ చేయడానికి ఉపయోగించబడాలి (ఉదాహరణకు, లింగం, వైవాహిక స్థితి, కస్టమర్ సేవా వర్గం మొదలైనవి). యాంకర్ కాకుండా, నాట్ అనుబంధిత లక్షణ పట్టికలు లేవు, మరియు దాని ఏకైక లక్షణం (పేరు) ఎల్లప్పుడూ కీతో ఒకే పట్టికలో నిల్వ చేయబడుతుంది. యాంకర్లు ఒకదానికొకటి కనెక్ట్ చేయబడిన విధంగానే నోడ్‌లు టై టేబుల్స్ (టై) ద్వారా యాంకర్‌లకు కనెక్ట్ చేయబడతాయి.

నోడ్స్ వాడకానికి సంబంధించి స్పష్టమైన అభిప్రాయం లేదు. ఉదాహరణకి, నికోలాయ్ గోలోవ్, రష్యాలో యాంకర్ మోడల్ వినియోగాన్ని చురుకుగా ప్రోత్సహించే వారు, (అసమంజసంగా కాదు) ఒక్క రిఫరెన్స్ పుస్తకం కోసం కూడా అది ఖచ్చితంగా చెప్పబడుతుందని నమ్ముతారు. ఎల్లప్పుడూ స్టాటిక్ మరియు సింగిల్-లెవల్ ఉంటుంది, కాబట్టి అన్ని వస్తువులకు పూర్తి స్థాయి యాంకర్‌ను వెంటనే ఉపయోగించడం మంచిది.

డేటా వాల్ట్ మరియు యాంకర్ మోడల్ మధ్య మరొక ముఖ్యమైన వ్యత్యాసం లభ్యత కనెక్షన్ల లక్షణాలు:

В డేటా వాల్ట్ లింక్‌లు హబ్‌ల మాదిరిగానే పూర్తి స్థాయి వస్తువులు మరియు కలిగి ఉంటాయి సొంత గుణాలు. ది యాంకర్ మోడల్ లింక్‌లు యాంకర్స్ మరియు కనెక్ట్ చేయడానికి మాత్రమే ఉపయోగించబడతాయి వారి స్వంత లక్షణాలను కలిగి ఉండకూడదు. ఈ వ్యత్యాసం గణనీయంగా భిన్నమైన మోడలింగ్ విధానాలకు దారి తీస్తుంది వాస్తవాలు, ఇది మరింత చర్చించబడుతుంది.

వాస్తవ నిల్వ

దీనికి ముందు, మేము ప్రధానంగా కొలత మోడలింగ్ గురించి మాట్లాడాము. వాస్తవాలు కొంచెం తక్కువగా ఉన్నాయి.

В డేటా వాల్ట్ వాస్తవాలను నిల్వ చేయడానికి ఒక సాధారణ వస్తువు లింక్, దీని ఉపగ్రహాలలో నిజమైన సూచికలు జోడించబడ్డాయి.

ఈ విధానం సహజంగా అనిపిస్తుంది. ఇది విశ్లేషించబడిన సూచికలకు సులభమైన ప్రాప్యతను అందిస్తుంది మరియు సాధారణంగా సాంప్రదాయ వాస్తవ పట్టికను పోలి ఉంటుంది (సూచికలు మాత్రమే పట్టికలోనే కాకుండా “పొరుగు” పట్టికలో నిల్వ చేయబడతాయి). కానీ ఆపదలు కూడా ఉన్నాయి: మోడల్ యొక్క సాధారణ మార్పులలో ఒకటి - ఫాక్ట్ కీ యొక్క విస్తరణ - అవసరం లింక్‌కి కొత్త విదేశీ కీని జోడిస్తోంది. మరియు ఇది, మాడ్యులారిటీని "విచ్ఛిన్నం చేస్తుంది" మరియు ఇతర వస్తువులకు సవరణల అవసరాన్ని సంభావ్యంగా కలిగిస్తుంది.

В యాంకర్ మోడల్ కనెక్షన్ దాని స్వంత లక్షణాలను కలిగి ఉండదు, కాబట్టి ఈ విధానం పని చేయదు - ఖచ్చితంగా అన్ని లక్షణాలు మరియు సూచికలు తప్పనిసరిగా ఒక నిర్దిష్ట యాంకర్‌కు లింక్ చేయబడాలి. దీని నుండి ముగింపు చాలా సులభం - ప్రతి వాస్తవానికి దాని స్వంత యాంకర్ కూడా అవసరం. మేము వాస్తవాలుగా భావించే కొన్నింటికి, ఇది సహజంగా కనిపించవచ్చు - ఉదాహరణకు, కొనుగోలు యొక్క వాస్తవాన్ని ఆబ్జెక్ట్ “ఆర్డర్” లేదా “రసీదు”, సెషన్‌కు సైట్‌ని సందర్శించడం మొదలైన వాటికి ఖచ్చితంగా తగ్గించవచ్చు. అటువంటి సహజమైన “క్యారియర్ ఆబ్జెక్ట్” ను కనుగొనడం అంత సులభం కాని వాస్తవాలు కూడా ఉన్నాయి - ఉదాహరణకు, ప్రతి రోజు ప్రారంభంలో గిడ్డంగులలోని వస్తువుల అవశేషాలు.

దీని ప్రకారం, యాంకర్ మోడల్‌లో ఫ్యాక్ట్ కీని విస్తరించేటప్పుడు మాడ్యులారిటీతో సమస్యలు తలెత్తవు (సంబంధిత యాంకర్‌కు కొత్త సంబంధాన్ని జోడించడం సరిపోతుంది), కానీ వాస్తవాలను ప్రదర్శించడానికి మోడల్‌ను రూపొందించడం తక్కువ నిస్సందేహంగా ఉంటుంది; “కృత్రిమ” యాంకర్లు కనిపించవచ్చు. అది వ్యాపార వస్తువు నమూనాను అస్పష్టమైన రీతిలో ప్రదర్శిస్తుంది.

వశ్యత ఎలా సాధించబడుతుంది

రెండు సందర్భాలలో ఫలిత నిర్మాణం కలిగి ఉంటుంది గణనీయంగా ఎక్కువ పట్టికలుసాంప్రదాయ కొలత కంటే. కానీ పట్టవచ్చు గణనీయంగా తక్కువ డిస్క్ స్థలం సాంప్రదాయ పరిమాణం వలె అదే సంస్కరణ లక్షణాలతో. సహజంగానే, ఇక్కడ మాయాజాలం లేదు - ఇది సాధారణీకరణ గురించి. ఉపగ్రహాలు (డేటా వాల్ట్‌లో) లేదా వ్యక్తిగత పట్టికలు (యాంకర్ మోడల్) అంతటా అట్రిబ్యూట్‌లను పంపిణీ చేయడం ద్వారా మేము తగ్గిస్తాము (లేదా పూర్తిగా తొలగిస్తాము) ఇతరులను మార్చేటప్పుడు కొన్ని లక్షణాల విలువల నకిలీ.

కోసం డేటా వాల్ట్ విజయాలు ఉపగ్రహాల మధ్య లక్షణాల పంపిణీపై ఆధారపడి ఉంటాయి యాంకర్ మోడల్ - ప్రతి కొలత వస్తువుకు సగటు సంస్కరణల సంఖ్యకు దాదాపు నేరుగా అనులోమానుపాతంలో ఉంటుంది.

అయితే, స్థల పొదుపు అనేది ముఖ్యమైనది, కానీ ప్రధానమైనది కాదు, గుణాలను విడిగా నిల్వ చేయడం వల్ల ప్రయోజనం. సంబంధాల యొక్క ప్రత్యేక నిల్వతో కలిసి, ఈ విధానం దుకాణాన్ని చేస్తుంది మాడ్యులర్ డిజైన్. దీనర్థం అటువంటి మోడల్‌లో వ్యక్తిగత లక్షణాలు మరియు పూర్తి కొత్త సబ్జెక్ట్ ఏరియాలను జోడించడం ఇలా కనిపిస్తుంది సూపర్ స్ట్రక్చర్ వాటిని మార్చకుండా ఇప్పటికే ఉన్న వస్తువుల సెట్‌పై. మరియు ఇది ఖచ్చితంగా వివరించిన పద్దతులను అనువైనదిగా చేస్తుంది.

ఇది ముక్క ఉత్పత్తి నుండి భారీ ఉత్పత్తికి మారడాన్ని కూడా పోలి ఉంటుంది - సాంప్రదాయ విధానంలో మోడల్ యొక్క ప్రతి పట్టిక ప్రత్యేకంగా ఉంటుంది మరియు ప్రత్యేక శ్రద్ధ అవసరం అయితే, సౌకర్యవంతమైన పద్దతులలో ఇది ఇప్పటికే ప్రామాణిక “భాగాల” సమితి. ఒక వైపు, మరిన్ని పట్టికలు ఉన్నాయి మరియు డేటాను లోడ్ చేయడం మరియు తిరిగి పొందడం ప్రక్రియలు మరింత క్లిష్టంగా ఉండాలి. మరోవైపు, వారు అవుతారు సాధారణ. అంటే ఉండవచ్చు ఆటోమేటెడ్ మరియు మెటాడేటా నడిచే. “మేము దానిని ఎలా వేస్తాము?” అనే ప్రశ్న, మెరుగుదలలను రూపొందించే పనిలో గణనీయమైన భాగాన్ని తీసుకోగల సమాధానం ఇప్పుడు విలువైనది కాదు (అలాగే పని ప్రక్రియలపై మోడల్‌ను మార్చడం వల్ల కలిగే ప్రభావం గురించి ప్రశ్న. )

అటువంటి వ్యవస్థలో విశ్లేషకులు అస్సలు అవసరం లేదని దీని అర్థం కాదు - ఎవరైనా ఇప్పటికీ లక్షణాలతో వస్తువుల సెట్ ద్వారా పని చేయాలి మరియు అన్నింటినీ ఎక్కడ మరియు ఎలా లోడ్ చేయాలో గుర్తించాలి. కానీ పని మొత్తం, అలాగే లోపం యొక్క సంభావ్యత మరియు ఖర్చు గణనీయంగా తగ్గింది. విశ్లేషణ దశలో మరియు ETL అభివృద్ధి సమయంలో, ఇది ముఖ్యమైన భాగంలో మెటాడేటాను సవరించడానికి తగ్గించబడుతుంది.

చీకటి వైపు

పైన పేర్కొన్నవన్నీ రెండు విధానాలను నిజంగా అనువైనవిగా, సాంకేతికంగా అభివృద్ధి చెందినవి మరియు పునరుక్తి మెరుగుదలకు తగినవిగా చేస్తాయి. వాస్తవానికి, "లేపనంలో బారెల్" కూడా ఉంది, దాని గురించి మీరు ఇప్పటికే ఊహించగలరని నేను భావిస్తున్నాను.

ఫ్లెక్సిబుల్ ఆర్కిటెక్చర్‌ల మాడ్యులారిటీకి ఆధారమైన డేటా డికాంపోజిషన్, పట్టికల సంఖ్య పెరుగుదలకు దారితీస్తుంది మరియు తదనుగుణంగా, ఓవర్ హెడ్ నమూనా చేసినప్పుడు చేరడానికి. ఒక డైమెన్షన్ యొక్క అన్ని లక్షణాలను పొందేందుకు, ఒక క్లాసిక్ స్టోర్‌లో ఒక ఎంపిక సరిపోతుంది, కానీ సౌకర్యవంతమైన నిర్మాణం కోసం మొత్తం శ్రేణి చేరికలు అవసరం. పైగా ఇవన్నీ రిపోర్టుల కోసం జాయిన్ కావాలంటే ముందే రాసుకోగలిగితే.. SQLని చేతితో రాయడం అలవాటు చేసుకున్న విశ్లేషకులకు రెట్టింపు కష్టాలు తప్పవు.

ఈ పరిస్థితిని సులభతరం చేసే అనేక వాస్తవాలు ఉన్నాయి:

పెద్ద పరిమాణాలతో పని చేస్తున్నప్పుడు, దాని లక్షణాలన్నీ దాదాపుగా ఏకకాలంలో ఉపయోగించబడవు. మోడల్‌లో మొదటి చూపులో కనిపించే దానికంటే తక్కువ చేరికలు ఉండవచ్చని దీని అర్థం. ఉపగ్రహాలకు అట్రిబ్యూట్‌లను కేటాయించేటప్పుడు డేటా వాల్ట్ షేరింగ్ యొక్క అంచనా ఫ్రీక్వెన్సీని కూడా పరిగణనలోకి తీసుకోవచ్చు. అదే సమయంలో, లోడింగ్ దశలో సర్రోగేట్‌లను రూపొందించడానికి మరియు మ్యాపింగ్ చేయడానికి ప్రధానంగా హబ్‌లు లేదా యాంకర్లు అవసరం మరియు ప్రశ్నలలో చాలా అరుదుగా ఉపయోగించబడతాయి (ఇది యాంకర్‌లకు ప్రత్యేకంగా వర్తిస్తుంది).

అన్ని చేరికలు కీ ద్వారా ఉంటాయి. అదనంగా, డేటాను నిల్వ చేయడానికి మరింత “కంప్రెస్డ్” మార్గం అవసరమైన చోట స్కానింగ్ టేబుల్‌ల ఓవర్‌హెడ్‌ను తగ్గిస్తుంది (ఉదాహరణకు, లక్షణం విలువ ద్వారా ఫిల్టర్ చేసినప్పుడు). ఇది వరుసకు అనేక వెర్షన్‌లతో ఒక భారీ డైమెన్షన్‌ను స్కాన్ చేయడం కంటే సాధారణీకరించిన డేటాబేస్ నుండి అనేక చేరికలతో నమూనా మరింత వేగంగా ఉంటుంది.

ఉదాహరణకు, ఇక్కడ వ్యాసం ఒక పట్టిక నుండి నమూనాతో యాంకర్ మోడల్ యొక్క పనితీరు యొక్క వివరణాత్మక తులనాత్మక పరీక్షను కలిగి ఉంది.

చాలా ఇంజిన్ మీద ఆధారపడి ఉంటుంది. అనేక ఆధునిక ప్లాట్‌ఫారమ్‌లు అంతర్గత చేరిక ఆప్టిమైజేషన్ మెకానిజమ్‌లను కలిగి ఉన్నాయి. ఉదాహరణకు, MS SQL మరియు Oracle తమ డేటాను ఇతర చేరికలకు మినహా ఎక్కడా ఉపయోగించనట్లయితే మరియు తుది ఎంపిక (టేబుల్/జాయిన్ ఎలిమినేషన్) మరియు MPP వెర్టికాపై ప్రభావం చూపకపోతే, టేబుల్‌లకు జాయిన్‌లను “స్కిప్” చేయవచ్చు. Avito నుండి సహోద్యోగుల అనుభవం, క్వెరీ ప్లాన్ యొక్క కొంత మాన్యువల్ ఆప్టిమైజేషన్ ఇచ్చిన యాంకర్ మోడల్‌కు అద్భుతమైన ఇంజన్ అని నిరూపించబడింది. మరోవైపు, యాంకర్ మోడల్‌ను నిల్వ చేయడం, ఉదాహరణకు, పరిమిత చేరిక మద్దతు ఉన్న క్లిక్ హౌస్‌లో, ఇంకా చాలా మంచి ఆలోచనగా కనిపించడం లేదు.

అదనంగా, రెండు నిర్మాణాలకు ఉన్నాయి ప్రత్యేక కదలికలు, డేటా యాక్సెస్‌ను సులభతరం చేస్తుంది (ప్రశ్న పనితీరు దృక్కోణం నుండి మరియు తుది వినియోగదారుల కోసం). ఉదాహరణకి, పాయింట్-ఇన్-టైమ్ పట్టికలు డేటా వాల్ట్‌లో లేదా ప్రత్యేక పట్టిక విధులు యాంకర్ మోడల్‌లో.

మొత్తం

పరిగణించబడే సౌకర్యవంతమైన నిర్మాణాల యొక్క ప్రధాన సారాంశం వారి "డిజైన్" యొక్క మాడ్యులారిటీ.

ఇది అనుమతించే ఈ ఆస్తి:

  • మెటాడేటా విస్తరణ మరియు ప్రాథమిక ETL అల్గారిథమ్‌లను వ్రాయడానికి సంబంధించిన కొన్ని ప్రారంభ తయారీ తర్వాత, మొదటి ఫలితాన్ని కస్టమర్‌కు త్వరగా అందించండి కేవలం కొన్ని మూలాధార వస్తువుల నుండి డేటాను కలిగి ఉన్న రెండు నివేదికల రూపంలో. మొత్తం ఆబ్జెక్ట్ మోడల్‌ను పూర్తిగా (పై స్థాయిలో కూడా) ఆలోచించాల్సిన అవసరం లేదు.
  • డేటా మోడల్ కేవలం 2-3 వస్తువులతో పని చేయడం ప్రారంభించవచ్చు (మరియు ఉపయోగకరంగా ఉంటుంది), ఆపై క్రమంగా పెరుగుతాయి (యాంకర్ మోడల్ నికోలాయ్ గురించి దరఖాస్తు చేసుకున్నాడు మైసిలియంతో మంచి పోలిక).
  • సబ్జెక్ట్ ఏరియాని విస్తరించడం మరియు కొత్త మూలాధారాలను జోడించడంతో సహా చాలా మెరుగుదలలు ఇప్పటికే ఉన్న కార్యాచరణను ప్రభావితం చేయదు మరియు ఇప్పటికే పని చేస్తున్న దేనినైనా విచ్ఛిన్నం చేసే ప్రమాదం లేదు.
  • ప్రామాణిక మూలకాలుగా కుళ్ళినందుకు ధన్యవాదాలు, అటువంటి వ్యవస్థలలోని ETL ప్రక్రియలు ఒకే విధంగా కనిపిస్తాయి, వాటి రచన అల్గారిథమైజేషన్‌కు మరియు చివరికి, ఆటోమేషన్.

ఈ వశ్యత ధర పనితీరు. అటువంటి నమూనాలపై ఆమోదయోగ్యమైన పనితీరును సాధించడం అసాధ్యం అని దీని అర్థం కాదు. చాలా తరచుగా, మీరు కోరుకున్న కొలమానాలను సాధించడానికి మీకు మరింత కృషి మరియు వివరాలకు శ్రద్ధ అవసరం కావచ్చు.

అనువర్తనాలు

ఎంటిటీ రకాలు డేటా వాల్ట్

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

డేటా వాల్ట్ గురించి మరింత సమాచారం:
డాన్ లిస్టాడ్ట్ వెబ్‌సైట్
రష్యన్‌లో డేటా వాల్ట్ గురించి అన్నీ
హబ్రేలో డేటా వాల్ట్ గురించి

ఎంటిటీ రకాలు యాంకర్ మోడల్

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

యాంకర్ మోడల్ గురించి మరిన్ని వివరాలు:

యాంకర్ మోడల్ సృష్టికర్తల వెబ్‌సైట్
Avitoలో యాంకర్ మోడల్‌ని అమలు చేసిన అనుభవం గురించిన కథనం

పరిగణించబడిన విధానాల యొక్క సాధారణ లక్షణాలు మరియు తేడాలతో కూడిన సారాంశ పట్టిక:

ఎజైల్ DWH డిజైన్ మెథడాలజీస్ యొక్క అవలోకనం

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి