Is réamhriachtanas tábhachtach é cáilíocht na sonraí sa stóras chun faisnéis luachmhar a fháil. Bíonn imoibriú slabhra diúltach mar thoradh ar dhroch-chaighdeán san fhadtréimhse.
Ar an gcéad dul síos, cailltear muinín san fhaisnéis a chuirtear ar fáil. Tá daoine ag tosú ar úsáid níos lú a bhaint as feidhmchláir Faisnéise Gnó; tá acmhainneacht na bhfeidhmchlár fós gan éileamh.
Mar thoradh air sin, tá infheistíocht bhreise sa tionscadal anailíse faoi cheist.
Freagracht as cáilíocht sonraí
Tá an ghné a bhaineann le cáilíocht sonraí a fheabhsú thar a bheith tábhachtach i dtionscadail BI. Mar sin féin, níl sé de phribhléid ag speisialtóirí teicniúla amháin.
Bíonn tionchar freisin ag gnéithe ar nós
Cultúr corparáideach
- An bhfuil suim ag na hoibrithe féin i dtáirgeadh dea-chaighdeán?
- Mura bhfuil, cén fáth nach bhfuil? D’fhéadfadh coinbhleacht leasa a bheith ann.
- B'fhéidir go bhfuil rialacha corparáideacha ann a chinneann cé atá freagrach as cáilíocht?
Na próisis
- Cad iad na sonraí a chruthaítear ag deireadh na slabhraí seo?
- B’fhéidir go bhfuil na córais oibriúcháin cumraithe sa chaoi is go gcaithfidh tú “casadh” chun é seo nó an cás sin a léiriú i ndáiríre.
- An ndéanann córais oibriúcháin fíorú agus réiteach sonraí iad féin?
Tá gach duine san eagraíocht freagrach as cáilíocht na sonraí i gcórais tuairiscithe.
Sainmhíniú agus brí
Tá cáilíocht cruthaithe sástacht ionchais na gcustaiméirí.
Ach níl sainmhíniú ar cháilíocht sonraí. Léiríonn sé an comhthéacs úsáide i gcónaí. Feidhmíonn an stóras sonraí agus an córas BI críocha éagsúla ná an córas oibriúcháin óna dtagann na sonraí.
Mar shampla, ar chóras oibriúcháin, féadfaidh an tréith chustaiméara a bheith ina réimse roghnach. Sa stór, is féidir an tréith seo a úsáid mar thoise agus tá gá lena líonadh. Rud a thugann isteach, ina dhiaidh sin, an gá atá le luachanna réamhshocraithe a líonadh.
Bíonn riachtanais stórála sonraí ag athrú i gcónaí agus de ghnáth bíonn siad níos airde ná iad siúd do chórais oibriúcháin. Ach is féidir é a bheith ar an mbealach eile freisin, nuair nach gá faisnéis mhionsonraithe a stóráil ón gcóras oibriúcháin sa stóráil.
Chun cáilíocht sonraí a dhéanamh intomhaiste, ní mór cur síos a dhéanamh ar a chaighdeáin. Ní mór do dhaoine a úsáideann faisnéis agus figiúirí dá gcuid oibre a bheith páirteach sa phróiseas tuairiscithe. D'fhéadfadh go mbeadh riail mar thoradh ar an rannpháirtíocht seo, agus ina dhiaidh sin is féidir a rá go sracfhéachaint ar an tábla an bhfuil earráid ann nó nach bhfuil. Ní mór an riail seo a fhormáidiú mar script/cód le haghaidh fíorú ina dhiaidh sin.
Cáilíocht sonraí a fheabhsú
Tá sé dodhéanta gach earráid hipitéiseach a ghlanadh agus a cheartú le linn an phróisis chun sonraí a luchtú isteach sa stóras. Ní féidir dea-chaighdeán sonraí a bhaint amach ach trí chomhoibriú dlúth idir na rannpháirtithe go léir. Ní mór do dhaoine a chuireann sonraí isteach i gcórais oibriúcháin a fháil amach cad iad na gníomhartha a eascraíonn as earráidí.
Is próiseas é cáilíocht sonraí. Ar an drochuair, níl straitéis ag go leor eagraíochtaí maidir le feabhsú leanúnach. Ní bhaineann go leor acu ach le sonraí a stóráil agus ní úsáideann siad lánacmhainneacht na gcóras anailíse. De ghnáth, nuair a bhíonn stórais sonraí á bhforbairt, caitear 70-80% den bhuiséad ar chomhtháthú sonraí a chur i bhfeidhm. Tá an próiseas monatóireachta agus feabhsaithe fós neamhiomlán, más ann ar chor ar bith.
Uirlisí
Is féidir le húsáid uirlisí bogearraí cabhrú leis an bpróiseas chun feabhas a chur ar cháilíocht sonraí agus monatóireacht a dhéanamh ar uathoibriú. Mar shampla, is féidir leo fíorú teicniúil struchtúir stórála a uathoibriú go hiomlán: formáid réimse, láithreacht luachanna réamhshocraithe, comhlíonadh ainmneacha réimse tábla.
D'fhéadfadh sé a bheith níos deacra an t-ábhar a sheiceáil. De réir mar a athraíonn riachtanais stórála, féadfaidh léirmhíniú na sonraí athrú freisin. Is féidir leis an uirlis féin a bheith ina thionscadal ollmhór a éilíonn tacaíocht.
Leid
Tá an cumas iontach ag bunachair shonraí choibhneasta, ina ndeartar stórais de ghnáth, tuairimí a chruthú. Is féidir iad a úsáid chun sonraí a sheiceáil go tapa má tá sonraí an ábhair ar eolas agat. Is féidir gach cás ina bhfuarthas earráid nó fadhb sna sonraí a thaifeadadh i bhfoirm fiosrúcháin bunachar sonraí.
Ar an mbealach seo, bunófar bonn eolais faoin ábhar. Ar ndóigh, ní mór iarratais den sórt sin a bheith go tapa. De ghnáth bíonn níos lú ama daonna de dhíth le haghaidh tuairimí a choinneáil ná le huirlisí bunaithe ar thábla. Bíonn an radharc réidh i gcónaí chun toradh na tástála a thaispeáint.
I gcás tuarascálacha tábhachtacha, d'fhéadfadh go mbeadh colún san amharc leis an bhfaighteoir. Déanann sé ciall na huirlisí BI céanna a úsáid chun tuairisc a thabhairt ar staid cháilíocht na sonraí sa stóras.
Sampla
Scríobhadh an cheist do bhunachar sonraí Oracle. Sa sampla seo, tugann na tástálacha luach uimhriúil ar ais is féidir a léirmhíniú de réir mar a theastaíonn. Is féidir na luachanna T_MIN agus T_MAX a úsáid chun an leibhéal aláraim a choigeartú. Baineadh úsáid as an réimse TUARASCÁIL uair amháin mar theachtaireacht i dtáirge tráchtála ETL nach raibh a fhios conas ríomhphoist a sheoladh i gceart, mar sin is “crutch” é rpad.
I gcás tábla mór, is féidir leat a chur leis, mar shampla, AGUS ROWNUM <= 10, i.e. má tá 10 earráid ann, tá sé seo go leor chun aláram a chur faoi deara.
CREATE OR REPLACE VIEW V_QC_DIM_PRODUCT_01 AS
SELECT
CASE WHEN OUTPUT>=T_MIN AND OUTPUT<=T_MAX
THEN 'OK' ELSE 'ERROR' END AS RESULT,
DESCRIPTION,
TABLE_NAME,
OUTPUT,
T_MIN,
T_MAX,
rpad(DESCRIPTION,60,' ') || rpad(OUTPUT,8,' ') || rpad(T_MIN,8,' ') || rpad(T_MAX,8,' ') AS REPORT
FROM (-- Test itself
SELECT
'DIM_PRODUCT' AS TABLE_NAME,
'Count of blanks' AS DESCRIPTION,
COUNT(*) AS OUTPUT,
0 AS T_MIN,
10 AS T_MAX
FROM DIM_PRODUCT
WHERE DIM_PRODUCT_ID != -1 -- not default value
AND ATTRIBUTE IS NULL ); -- count blanks
Úsáideann an foilseachán ábhair ón leabhar
Ronald Bachmann, an Dr. Guido Kemper
Raus aus der BI-Falle
Wie Business Intelligence le Erfolg wird
Foinse: will.com