Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē

Čau Habr!

Dati ir uzņēmuma visvērtÄ«gākā vērtÄ«ba. GandrÄ«z katrs digitālais uzņēmums to apgalvo. Ar to ir grÅ«ti strÄ«dēties: neviena liela IT konference nenotiek, neapspriežot pieejas datu pārvaldÄ«Å”anai, uzglabāŔanai un apstrādei.

Dati pie mums nonāk no ārpuses, tie tiek Ä£enerēti arÄ« uzņēmuma iekÅ”ienē, un, ja runājam par datiem no telekomunikāciju uzņēmuma, tad iekŔējiem darbiniekiem Ŕī ir informācijas krātuve par klientu, viņa interesēm, paradumiem, atraÅ”anās vietu. Ar pareizu profilÄ“Å”anu un segmentāciju reklāmas piedāvājumi ir visefektÄ«vākie. Tomēr praksē ne viss ir tik rožaini. Dati, ko uzņēmumi glabā, var bÅ«t bezcerÄ«gi novecojuÅ”i, lieki, atkārtoti, vai arÄ« to esamÄ«ba nav zināma nevienam, izņemot Å”auru lietotāju loku. ĀÆ_(惄)_/ĀÆ

Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē
Vārdu sakot, dati ir jāpārvalda efektÄ«vi ā€“ tikai tad tie kļūs par aktÄ«vu, kas nes reālu labumu un peļņu biznesam. Diemžēl datu pārvaldÄ«bas problēmu risināŔanai ir jāpārvar diezgan daudz sarežģījumu. To pamatā galvenokārt ir gan vēsturiskais mantojums sistēmu ā€œzooloÄ£isko dārzuā€ veidā, gan vienotu procesu un pieejas trÅ«kums to pārvaldÄ«bā. Bet ko nozÄ«mē bÅ«t ā€œvadÄ«tam ar datiemā€?

Tas ir tieÅ”i tas, par ko mēs runāsim zem griezuma, kā arÄ« par to, kā atvērtā koda steks mums palÄ«dzēja.

Stratēģiskās datu pārvaldÄ«bas jēdziens Data Governance (DG) jau ir diezgan plaÅ”i pazÄ«stams Krievijas tirgÅ«, un tā ievieÅ”anas rezultātā biznesa sasniegtie mērÄ·i ir skaidri un skaidri deklarēti. MÅ«su uzņēmums nebija izņēmums un izvirzÄ«ja sev uzdevumu ieviest datu pārvaldÄ«bas jēdzienu.

Tātad, kur mēs sākām? Sākumā mēs izvirzījām sev galvenos mērķus:

  1. Saglabājiet mūsu datus pieejamus.
  2. NodroŔiniet datu dzīves cikla caurspīdīgumu.
  3. NodroÅ”iniet uzņēmuma lietotājiem konsekventus, konsekventus datus.
  4. NodroÅ”iniet uzņēmuma lietotājus ar pārbaudÄ«tiem datiem.

Mūsdienās programmatūras tirgū ir ducis datu pārvaldības klases rīku.

Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē

Taču pēc detalizētas risinājumu analīzes un izpētes mēs sev ierakstījām vairākus kritiskus komentārus:

  • Lielākā daļa ražotāju piedāvā visaptveroÅ”u risinājumu komplektu, kas mums ir lieks un dublē esoÅ”o funkcionalitāti. Turklāt dārgs resursu ziņā, integrācija paÅ”reizējā IT ainavā.
  • Funkcionalitāte un saskarne ir paredzēta tehnologiem, nevis biznesa galalietotājiem.
  • Zems produktu izdzÄ«voÅ”anas lÄ«menis un veiksmÄ«gas ievieÅ”anas trÅ«kums Krievijas tirgÅ«.
  • Augstas programmatÅ«ras izmaksas un turpmāks atbalsts.

IepriekÅ” izteiktie kritēriji un ieteikumi attiecÄ«bā uz programmatÅ«ras importa aizstāŔanu Krievijas uzņēmumiem pārliecināja mÅ«s virzÄ«ties uz mÅ«su paÅ”u attÄ«stÄ«bu atvērtā pirmkoda stekā. Platforma, kuru mēs izvēlējāmies, bija Django, bezmaksas un atvērtā koda ietvars, kas rakstÄ«ts Python. Tādējādi mēs esam identificējuÅ”i galvenos moduļus, kas veicinās iepriekÅ” minēto mērÄ·u sasniegÅ”anu:

  1. AtskaiŔu reģistrs.
  2. Biznesa glosārijs.
  3. Modulis tehnisko transformāciju aprakstīŔanai.
  4. Modulis datu dzīves cikla aprakstīŔanai no avota līdz BI rīkam.
  5. Datu kvalitātes kontroles modulis.

Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē

AtskaiŔu reģistrs

Kā liecina iekŔējo pētÄ«jumu rezultāti lielos uzņēmumos, risinot ar datiem saistÄ«tas problēmas, darbinieki to meklÄ“Å”anai velta 40-80% sava laika. Tāpēc mēs izvirzÄ«jām sev uzdevumu padarÄ«t atklātu informāciju par esoÅ”ajiem pārskatiem, kas iepriekÅ” bija pieejami tikai klientiem. Tādējādi mēs samazinām laiku jaunu atskaiÅ”u Ä£enerÄ“Å”anai un nodroÅ”inām datu demokratizāciju.

Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē

Pārskatu reÄ£istrs ir kļuvis par vienotu pārskatu logu iekŔējiem lietotājiem no dažādiem reÄ£ioniem, departamentiem un nodaļām. Tajā ir apkopota informācija par informācijas pakalpojumiem, kas izveidoti vairākos uzņēmuma korporatÄ«vajos krātuvēs, un Rostelecom to ir daudz.

Taču reÄ£istrs nav tikai sauss izstrādāto atskaiÅ”u saraksts. Katram pārskatam mēs sniedzam informāciju, kas nepiecieÅ”ama, lai lietotājs varētu ar to iepazÄ«ties:

  • Ä«ss ziņojuma apraksts;
  • datu pieejamÄ«bas dziļums;
  • klientu segments;
  • vizualizācijas rÄ«ks;
  • uzņēmuma krātuves nosaukums;
  • biznesa funkcionālās prasÄ«bas;
  • saite uz ziņojumu;
  • saite uz piekļuves pieteikumu;
  • Ä«stenoÅ”anas statuss.

Pārskatiem ir pieejama lietojuma lÄ«meņa analÄ«ze, un pārskati ir sakārtoti saraksta augÅ”daļā, pamatojoties uz žurnāla analÄ«zi, pamatojoties uz unikālo lietotāju skaitu. Un tas nav viss. Papildus vispārÄ«gajiem raksturlielumiem esam snieguÅ”i arÄ« detalizētu pārskatu atribÅ«tu sastāva aprakstu ar vērtÄ«bu un aprēķinu metožu piemēriem. Šāda detalizācija uzreiz sniedz lietotājam atbildi, vai pārskats viņam noder vai nē.

Å Ä« moduļa izstrāde bija nozÄ«mÄ«gs solis datu demokratizācijā un ievērojami samazināja laiku, kas nepiecieÅ”ams vajadzÄ«gās informācijas atraÅ”anai. Papildus meklÄ“Å”anas laika samazināŔanai ir samazinājies arÄ« pieprasÄ«jumu skaits atbalsta komandai sniegt konsultācijas. Nevar neatzÄ«mēt vēl vienu noderÄ«gu rezultātu, ko panācām, veidojot vienotu atskaiÅ”u reÄ£istru ā€“ novērÅ”ot dublēto atskaiÅ”u veidoÅ”anu dažādām struktÅ«rvienÄ«bām.

Biznesa glosārijs

JÅ«s visi zināt, ka pat vienā uzņēmumā uzņēmumi runā dažādās valodās. Jā, viņi lieto vienus un tos paÅ”us terminus, taču tie nozÄ«mē pilnÄ«gi dažādas lietas. Lai atrisinātu Å”o problēmu, ir paredzēts biznesa glosārijs.

Mums biznesa glosārijs nav tikai uzziņu grāmata ar terminu aprakstu un aprēķinu metodiku. Å Ä« ir pilnvērtÄ«ga vide terminoloÄ£ijas izstrādei, saskaņoÅ”anai un apstiprināŔanai, attiecÄ«bu veidoÅ”anai starp terminiem un citiem uzņēmuma informācijas aktÄ«viem. Pirms ievadÄ«Å”anas biznesa glosārijā terminam ir jāiziet visi apstiprināŔanas posmi ar biznesa klientiem un datu kvalitātes centru. Tikai pēc tam tas kļūst pieejams lietoÅ”anai.

Kā jau rakstÄ«ju iepriekÅ”, Ŕī rÄ«ka unikalitāte ir tāda, ka tas ļauj izveidot savienojumus no biznesa termina lÄ«meņa ar konkrētiem lietotāju pārskatiem, kuros tas tiek izmantots, kā arÄ« ar fizisko datu bāzes objektu lÄ«meni.

Datu pārvaldÄ«ba uzņēmuma iekÅ”ienē

Tas ir iespējams, izmantojot glosāriju terminu identifikatorus detalizētā reÄ£istra atskaiÅ”u aprakstā un fizisko datu bāzes objektu aprakstā.

Å obrÄ«d vārdnÄ«cā ir definēti un saskaņoti vairāk nekā 4000 terminu. Tā izmantoÅ”ana vienkārÅ”o un paātrina ienākoÅ”o pieprasÄ«jumu par izmaiņām uzņēmuma informācijas sistēmās apstrādi. Ja nepiecieÅ”amais indikators jau ir ieviests kādā pārskatā, tad lietotājs uzreiz redzēs gatavu atskaiÅ”u kopu, kur Å”is indikators ir izmantots, un varēs lemt par esoŔās funkcionalitātes efektÄ«vu atkārtotu izmantoÅ”anu vai tās minimālu modifikāciju, neiesākot jauni pieprasÄ«jumi jauna ziņojuma izstrādei.

Modulis tehnisko transformāciju un DataLineage aprakstīŔanai

Kas ir Å”ie moduļi, jÅ«s jautājat? Nepietiek tikai ar Pārskatu reÄ£istra un glosārija ievieÅ”anu, ir arÄ« nepiecieÅ”ams visus biznesa terminus pamatot uz fiziskās datu bāzes modeļa. Tādējādi mēs varējām pabeigt datu dzÄ«ves cikla veidoÅ”anas procesu no avota sistēmām lÄ«dz BI vizualizācijai visos datu noliktavas slāņos. Citiem vārdiem sakot, izveidojiet DataLineage.

Mēs izstrādājām saskarni, kuras pamatā ir iepriekÅ” uzņēmumā izmantotais formāts datu transformācijas noteikumu un loÄ£ikas aprakstÄ«Å”anai. Caur interfeisu tiek ievadÄ«ta tāda pati informācija kā iepriekÅ”, taču par priekÅ”noteikumu ir kļuvusi termina identifikators definÄ«cija no biznesa glosārija. Tādā veidā mēs veidojam saikni starp biznesa un fizisko slāni.

Kam tas vajadzÄ«gs? Kas bija nepareizi ar veco formātu, ar kuru strādājāt vairākus gadus? Cik pieauguÅ”as darbaspēka izmaksas prasÄ«bu Ä£enerÄ“Å”anai? RÄ«ka ievieÅ”anas laikā mums bija jārisina Ŕādi jautājumi. Atbildes Å”eit ir pavisam vienkārÅ”as ā€“ tas ir vajadzÄ«gs mums visiem, mÅ«su uzņēmuma datu birojam un lietotājiem.

PatieŔām, darbiniekiem bija jāpielāgojas, sākumā tas nedaudz sadārdzināja darbaspēka izmaksas dokumentācijas sagatavoÅ”anai, bet mēs Å”o jautājumu sakārtojām. Prakse, problēmzonu noteikÅ”ana un optimizÄ“Å”ana ir paveikusi savu darbu. Esam sasnieguÅ”i galveno ā€“ esam uzlabojuÅ”i izstrādāto prasÄ«bu kvalitāti. Obligātie lauki, vienotas atsauces grāmatas, ievades maskas, iebÅ«vētās pārbaudes - tas viss ļāva bÅ«tiski uzlabot transformāciju aprakstu kvalitāti. Mēs atteicāmies no prakses nodot skriptus kā izstrādes prasÄ«bas un dalÄ«jāmies zināŔanās, kas bija pieejamas tikai izstrādes komandai. Ä¢enerētā metadatu datubāze ievērojami samazina laiku, kas nepiecieÅ”ams regresijas analÄ«zes veikÅ”anai, un nodroÅ”ina iespēju ātri novērtēt izmaiņu ietekmi uz jebkuru IT ainavas slāni (vitrÄ«nas atskaites, apkopojumi, avoti).

Kāds tam sakars ar parastajiem atskaiÅ”u lietotājiem, kādas ir viņu priekÅ”rocÄ«bas? Pateicoties iespējai izveidot DataLineage, mÅ«su lietotāji, pat tie, kas ir tālu no SQL un citām programmÄ“Å”anas valodām, ātri saņem informāciju par avotiem un objektiem, uz kuru pamata tiek Ä£enerēts konkrēts ziņojums.

Datu kvalitātes kontroles modulis

Viss, par ko mēs runājām iepriekÅ” saistÄ«bā ar datu pārskatāmÄ«bas nodroÅ”ināŔanu, nav svarÄ«gi, nesaprotot, ka dati, ko sniedzam lietotājiem, ir pareizi. Viens no mÅ«su datu pārvaldÄ«bas koncepcijas svarÄ«gajiem moduļiem ir datu kvalitātes kontroles modulis.

PaÅ”reizējā posmā Å”is ir atlasÄ«to entÄ«tiju čeku katalogs. Produkta izstrādes tuvākais mērÄ·is ir paplaÅ”ināt pārbaužu sarakstu un integrēties ar pārskatu reÄ£istru.
Ko tas dos un kam? Reģistra gala lietotājam būs pieejama informācija par plānotajiem un faktiskajiem atskaites gatavības datumiem, veikto pārbaužu rezultātiem ar dinamiku un informācijai par atskaitē ielādētajiem avotiem.

Mūsu darba procesos integrētais datu kvalitātes modulis ir:

  • Ātra klientu vēlmju veidoÅ”ana.
  • Lēmumu pieņemÅ”ana par datu turpmāku izmantoÅ”anu.
  • Provizoriska problēmu punktu kopuma iegÅ«Å”ana darba sākumposmā regulāras kvalitātes kontroles izstrādei.

Protams, tie ir pirmie soļi pilnvērtÄ«ga datu pārvaldÄ«bas procesa veidoÅ”anā. Taču esam pārliecināti, ka tikai mērÄ·tiecÄ«gi veicot Å”o darbu, aktÄ«vi ievieÅ”ot darba procesā datu pārvaldÄ«bas rÄ«kus, nodroÅ”ināsim saviem klientiem informācijas saturu, augstu uzticÄ«bas lÄ«meni datiem, to saņemÅ”anas caurskatāmÄ«bu un paātrināsim palaiÅ”anas ātrumu. jauna funkcionalitāte.

DataOffice komanda

Avots: www.habr.com

Pievieno komentāru