Qalîteya daneyê di embarê de

Ji bo bidestxistina agahdariya hêja, qalîteya daneyên di wargehê de şertek girîng e. Kalîteya nebaş di demek dirêj de dibe sedema reaksiyonek zincîreyek neyînî.
Pêşîn, baweriya bi agahdariya peyda winda dibe. Mirov dest bi karanîna serîlêdanên Agahdariya Karsaziyê kêm dikin; potansiyela serîlêdanan bê îddîa dimîne.
Wekî encamek, veberhênana bêtir di projeya analîtîk de tê guman kirin.

Berpirsiyariya kalîteya daneyê

Aliyê ku bi başkirina kalîteya daneyê ve girêdayî ye di projeyên BI de mega-girîng e. Lêbelê, ew ne îmtiyaza tenê pisporên teknîkî ye.
Kalîteya daneyê jî ji hêla aliyên weha ve tê bandor kirin

çanda Corporate

  • Ma karker bi xwe eleqedar in ku kalîteya baş hilberînin?
  • Ger na, çima na? Dibe ku nakokiya berjewendiyan hebe.
  • Dibe ku qaîdeyên pargîdanî hene ku diyar dikin ka kî ji kalîteyê berpirsiyar e?

Pêvajoyên

  • Di dawiya van zincîran de kîjan dane têne afirandin?
  • Dibe ku pergalên xebitandinê bi vî rengî hatine mîheng kirin ku hûn hewce ne ku "qewirandin" bikin da ku vê an wê rewşê di rastiyê de nîşan bidin.
  • Ma pergalên xebitandinê bi xwe verastkirin û lihevhatinê pêk tînin?

Her kes di rêxistinê de ji kalîteya daneyê di pergalên raporkirinê de berpirsiyar e.

Pênase û wate

Qalîteyê razîbûna îsbatkirî ya hêviyên xerîdar e.

Lê qalîteya daneyê pênaseyekê nagire. Ew her gav çarçoveya karanîna nîşan dide. Pargîdaniya daneyê û pergala BI ji pergala xebitandinê ya ku dane jê tê ji armancên cûda re xizmet dike.

Mînakî, li ser pergalek xebitandinê, taybetmendiya xerîdar dibe ku zeviyek vebijarkî be. Di depoyê de, ev taybetmendî dikare wekî pîvanek were bikar anîn û dagirtina wê hewce ye. Ku, di encamê de, hewcedariya dagirtina nirxên xwerû destnîşan dike.

Pêdiviyên hilanîna daneyê bi domdarî diguhezin û ew bi gelemperî ji yên pergalên xebitandinê bilindtir in. Lê ew dikare berevajî jî be, gava ku ne hewce ye ku agahdariya berfireh ji pergala xebitandinê di hilanînê de hilîne.

Ji bo ku kalîteya daneyê were pîvandin, divê standardên wê bêne diyar kirin. Kesên ku agahî û jimareyan ji bo karê xwe bi kar tînin divê tevlî pêvajoya danasînê bibin. Encama vê tevlêbûnê dibe ku qaîdeyek be, li dûv wê meriv dikare bi nihêrînek li ser maseyê bibêje ka xeletiyek heye an na. Pêdivî ye ku ev qaîdeyek ji bo verastkirina paşê wekî skrîpt/kod were format kirin.

Başkirina kalîteya daneyê

Di pêvajoya barkirina daneyan de ne gengaz e ku meriv hemî xeletiyên hîpotetîk paqij bike û rast bike. Qalîteya daneya baş tenê bi hevkariya nêzîk di navbera hemî beşdaran de dikare were bidestxistin. Kesên ku daneyan dikevin pergalên xebitandinê hewce ne ku fêr bibin ka çi kiryar dibe sedema xeletiyan.

Kalîteya daneyê pêvajoyek e. Mixabin, gelek rêxistin ne xwedî stratejiyek ji bo pêşkeftina domdar in. Pir kes xwe bi tenê hilanîna daneyan sînordar dikin û hemî potansiyela pergalên analîtîk bikar naynin. Bi gelemperî, dema pêşdebirina depoyên daneyê, 70-80% ji budceyê ji bo pêkanîna yekbûna daneyan tê xerc kirin. Pêvajoya şopandin û başkirinê, heke hebe, ne temam dimîne.

Amûr

Bikaranîna amûrên nermalavê dikare di pêvajoya otomatîkkirina başkirina kalîteya daneyê û çavdêriyê de bibe alîkar. Mînakî, ew dikarin verastkirina teknîkî ya strukturên hilanînê bi tevahî otomatîk bikin: formata zeviyê, hebûna nirxên xwerû, lihevhatina navên zeviyên tabloyê.

Dibe ku kontrolkirina naverokê dijwartir be. Gava ku pêdiviyên hilanînê diguhezin, dibe ku şirovekirina daneyan jî biguhere. Amûr bixwe dikare bibe projeyek mezin ku piştgirî hewce dike.

Tip

Databasên pêwendîdar, ku tê de firotgeh bi gelemperî têne sêwirandin, xwedan jêhatîbûnek berbiçav e ku nêrînan biafirîne. Heke hûn taybetmendiyên naverokê dizanin ew dikarin werin bikar anîn da ku zû daneyan kontrol bikin. Her bûyera dîtina xeletiyek an pirsgirêkek di daneyê de dikare di forma lêpirsînek databasê de were tomar kirin.

Bi vî awayî dê di derbarê naverokê de bingehek zanînê çêbibe. Bê guman, daxwazên weha divê bilez bin. Nêrîn bi gelemperî ji amûrên bingehîn ên tabloyê ji bo parastinê kêmtir wextê mirovî hewce dike. Dîtin her gav amade ye ku encama ceribandinê nîşan bide.
Di mijara raporên girîng de, dîtin dikare stûnek bi wergir re hebe. Aqil e ku meriv heman amûrên BI-ê bikar bîne da ku li ser rewşa kalîteya daneyê ya li wargehê rapor bike.

Nimûne:

Pirs ji bo databasa Oracle hate nivîsandin. Di vê nimûneyê de, ceribandin nirxek hejmarî vedigerînin ku dikare wekî ku tê xwestin were şîrove kirin. Nirxên T_MIN û T_MAX dikarin werin bikar anîn da ku asta alarmê rast bikin. Qada REPORT carekê di hilberek bazirganî ya ETL de wekî peyamek hate bikar anîn ku nizanibû meriv çawa bi rêkûpêk e-nameyê bişîne, ji ber vê yekê rpad "kûçikek" e.

Di mijara tabloyek mezin de, hûn dikarin, wek nimûne, Û RÊXÊN <= 10, yanî lê zêde bikin. heke 10 xeletî hebin, wê hingê ev bes e ku bibe sedema alarmê.

CREATE OR REPLACE VIEW V_QC_DIM_PRODUCT_01 AS
SELECT
  CASE WHEN OUTPUT>=T_MIN AND OUTPUT<=T_MAX
  THEN 'OK' ELSE 'ERROR' END AS RESULT,
  DESCRIPTION,
  TABLE_NAME, 
  OUTPUT, 
  T_MIN,
  T_MAX,
  rpad(DESCRIPTION,60,' ') || rpad(OUTPUT,8,' ') || rpad(T_MIN,8,' ') || rpad(T_MAX,8,' ') AS REPORT
FROM (-- Test itself
  SELECT
    'DIM_PRODUCT' AS TABLE_NAME,
    'Count of blanks' AS DESCRIPTION,
    COUNT(*) AS OUTPUT,
    0 AS T_MIN,
    10 AS T_MAX
  FROM DIM_PRODUCT
  WHERE DIM_PRODUCT_ID != -1 -- not default value
  AND ATTRIBUTE IS NULL ); -- count blanks

Di weşanê de materyalên pirtûkê bi kar tîne
Ronald Bachmann, Dr. Guido Kemper
Raus aus der BI-Falle
Wie Business Intelligence zum Erfolg wird


Source: www.habr.com

Add a comment