Ji bo bidestxistina agahdariya hêja, qalîteya daneyên di wargehê de şertek girîng e. Kalîteya nebaş di demek dirêj de dibe sedema reaksiyonek zincîreyek neyînî.
Pêşîn, baweriya bi agahdariya peyda winda dibe. Mirov dest bi karanîna serîlêdanên Agahdariya Karsaziyê kêm dikin; potansiyela serîlêdanan bê îddîa dimîne.
Wekî encamek, veberhênana bêtir di projeya analîtîk de tê guman kirin.
Berpirsiyariya kalîteya daneyê
Aliyê ku bi başkirina kalîteya daneyê ve girêdayî ye di projeyên BI de mega-girîng e. Lêbelê, ew ne îmtiyaza tenê pisporên teknîkî ye.
Kalîteya daneyê jî ji hêla aliyên weha ve tê bandor kirin
çanda Corporate
- Ma karker bi xwe eleqedar in ku kalîteya baş hilberînin?
- Ger na, çima na? Dibe ku nakokiya berjewendiyan hebe.
- Dibe ku qaîdeyên pargîdanî hene ku diyar dikin ka kî ji kalîteyê berpirsiyar e?
Pêvajoyên
- Di dawiya van zincîran de kîjan dane têne afirandin?
- Dibe ku pergalên xebitandinê bi vî rengî hatine mîheng kirin ku hûn hewce ne ku "qewirandin" bikin da ku vê an wê rewşê di rastiyê de nîşan bidin.
- Ma pergalên xebitandinê bi xwe verastkirin û lihevhatinê pêk tînin?
Her kes di rêxistinê de ji kalîteya daneyê di pergalên raporkirinê de berpirsiyar e.
Pênase û wate
Qalîteyê razîbûna îsbatkirî ya hêviyên xerîdar e.
Lê qalîteya daneyê pênaseyekê nagire. Ew her gav çarçoveya karanîna nîşan dide. Pargîdaniya daneyê û pergala BI ji pergala xebitandinê ya ku dane jê tê ji armancên cûda re xizmet dike.
Mînakî, li ser pergalek xebitandinê, taybetmendiya xerîdar dibe ku zeviyek vebijarkî be. Di depoyê de, ev taybetmendî dikare wekî pîvanek were bikar anîn û dagirtina wê hewce ye. Ku, di encamê de, hewcedariya dagirtina nirxên xwerû destnîşan dike.
Pêdiviyên hilanîna daneyê bi domdarî diguhezin û ew bi gelemperî ji yên pergalên xebitandinê bilindtir in. Lê ew dikare berevajî jî be, gava ku ne hewce ye ku agahdariya berfireh ji pergala xebitandinê di hilanînê de hilîne.
Ji bo ku kalîteya daneyê were pîvandin, divê standardên wê bêne diyar kirin. Kesên ku agahî û jimareyan ji bo karê xwe bi kar tînin divê tevlî pêvajoya danasînê bibin. Encama vê tevlêbûnê dibe ku qaîdeyek be, li dûv wê meriv dikare bi nihêrînek li ser maseyê bibêje ka xeletiyek heye an na. Pêdivî ye ku ev qaîdeyek ji bo verastkirina paşê wekî skrîpt/kod were format kirin.
Başkirina kalîteya daneyê
Di pêvajoya barkirina daneyan de ne gengaz e ku meriv hemî xeletiyên hîpotetîk paqij bike û rast bike. Qalîteya daneya baş tenê bi hevkariya nêzîk di navbera hemî beşdaran de dikare were bidestxistin. Kesên ku daneyan dikevin pergalên xebitandinê hewce ne ku fêr bibin ka çi kiryar dibe sedema xeletiyan.
Kalîteya daneyê pêvajoyek e. Mixabin, gelek rêxistin ne xwedî stratejiyek ji bo pêşkeftina domdar in. Pir kes xwe bi tenê hilanîna daneyan sînordar dikin û hemî potansiyela pergalên analîtîk bikar naynin. Bi gelemperî, dema pêşdebirina depoyên daneyê, 70-80% ji budceyê ji bo pêkanîna yekbûna daneyan tê xerc kirin. Pêvajoya şopandin û başkirinê, heke hebe, ne temam dimîne.
Amûr
Bikaranîna amûrên nermalavê dikare di pêvajoya otomatîkkirina başkirina kalîteya daneyê û çavdêriyê de bibe alîkar. Mînakî, ew dikarin verastkirina teknîkî ya strukturên hilanînê bi tevahî otomatîk bikin: formata zeviyê, hebûna nirxên xwerû, lihevhatina navên zeviyên tabloyê.
Dibe ku kontrolkirina naverokê dijwartir be. Gava ku pêdiviyên hilanînê diguhezin, dibe ku şirovekirina daneyan jî biguhere. Amûr bixwe dikare bibe projeyek mezin ku piştgirî hewce dike.
Tip
Databasên pêwendîdar, ku tê de firotgeh bi gelemperî têne sêwirandin, xwedan jêhatîbûnek berbiçav e ku nêrînan biafirîne. Heke hûn taybetmendiyên naverokê dizanin ew dikarin werin bikar anîn da ku zû daneyan kontrol bikin. Her bûyera dîtina xeletiyek an pirsgirêkek di daneyê de dikare di forma lêpirsînek databasê de were tomar kirin.
Bi vî awayî dê di derbarê naverokê de bingehek zanînê çêbibe. Bê guman, daxwazên weha divê bilez bin. Nêrîn bi gelemperî ji amûrên bingehîn ên tabloyê ji bo parastinê kêmtir wextê mirovî hewce dike. Dîtin her gav amade ye ku encama ceribandinê nîşan bide.
Di mijara raporên girîng de, dîtin dikare stûnek bi wergir re hebe. Aqil e ku meriv heman amûrên BI-ê bikar bîne da ku li ser rewşa kalîteya daneyê ya li wargehê rapor bike.
Nimûne:
Pirs ji bo databasa Oracle hate nivîsandin. Di vê nimûneyê de, ceribandin nirxek hejmarî vedigerînin ku dikare wekî ku tê xwestin were şîrove kirin. Nirxên T_MIN û T_MAX dikarin werin bikar anîn da ku asta alarmê rast bikin. Qada REPORT carekê di hilberek bazirganî ya ETL de wekî peyamek hate bikar anîn ku nizanibû meriv çawa bi rêkûpêk e-nameyê bişîne, ji ber vê yekê rpad "kûçikek" e.
Di mijara tabloyek mezin de, hûn dikarin, wek nimûne, Û RÊXÊN <= 10, yanî lê zêde bikin. heke 10 xeletî hebin, wê hingê ev bes e ku bibe sedema alarmê.
CREATE OR REPLACE VIEW V_QC_DIM_PRODUCT_01 AS
SELECT
CASE WHEN OUTPUT>=T_MIN AND OUTPUT<=T_MAX
THEN 'OK' ELSE 'ERROR' END AS RESULT,
DESCRIPTION,
TABLE_NAME,
OUTPUT,
T_MIN,
T_MAX,
rpad(DESCRIPTION,60,' ') || rpad(OUTPUT,8,' ') || rpad(T_MIN,8,' ') || rpad(T_MAX,8,' ') AS REPORT
FROM (-- Test itself
SELECT
'DIM_PRODUCT' AS TABLE_NAME,
'Count of blanks' AS DESCRIPTION,
COUNT(*) AS OUTPUT,
0 AS T_MIN,
10 AS T_MAX
FROM DIM_PRODUCT
WHERE DIM_PRODUCT_ID != -1 -- not default value
AND ATTRIBUTE IS NULL ); -- count blanks
Di weşanê de materyalên pirtûkê bi kar tîne
Ronald Bachmann, Dr. Guido Kemper
Raus aus der BI-Falle
Wie Business Intelligence zum Erfolg wird
Source: www.habr.com