په ګودام کې د معلوماتو کیفیت

په ګودام کې د معلوماتو کیفیت د ارزښتناکو معلوماتو ترلاسه کولو لپاره یو مهم شرط دی. ضعیف کیفیت په اوږد مهال کې د منفي سلسلې غبرګون لامل کیږي.
لومړی، په چمتو شوي معلوماتو باور له لاسه ورکوي. خلک د سوداګرۍ استخباراتو غوښتنلیکونه لږ کارول پیل کوي؛ د غوښتنلیکونو احتمال بې ادعا پاتې دی.
د پایلې په توګه، په تحلیلي پروژه کې نوره پانګه اچونه تر پوښتنې لاندې راځي.

د معلوماتو کیفیت لپاره مسؤلیت

د معلوماتو کیفیت ښه کولو پورې اړوند اړخ د BI پروژو کې خورا مهم دی. په هرصورت، دا یوازې د تخنیکي متخصصینو امتیاز نه دی.
د معلوماتو کیفیت هم د ورته اړخونو لخوا اغیزمن کیږي

کارپوریټ کلتور

  • ایا کارګران پخپله د ښه کیفیت تولید سره علاقه لري؟
  • که نه، ولې نه؟ کیدای شي د ګټو ټکر وي.
  • شاید دلته د شرکت مقررات شتون ولري چې مشخص کوي څوک د کیفیت لپاره مسؤل دی؟

پروسې

  • د دې زنځیرونو په پای کې کوم معلومات رامینځته کیږي؟
  • شاید عملیاتي سیسټمونه په داسې ډول تنظیم شوي وي چې تاسو اړتیا لرئ د دې یا هغه حالت په واقعیت کې منعکس کولو لپاره "موټر" ته اړتیا ولرئ.
  • ایا عملیاتي سیسټمونه پخپله د معلوماتو تصدیق او پخلاینې ترسره کوي؟

په سازمان کې هرڅوک د راپور ورکولو سیسټمونو کې د معلوماتو کیفیت مسؤل دی.

تعریف او معنی

کیفیت د پیرودونکو توقعاتو ثابت رضایت دی.

مګر د معلوماتو کیفیت تعریف نلري. دا تل د کارولو شرایط منعکس کوي. د ډیټا ګودام او BI سیسټم د عملیاتي سیسټم په پرتله مختلف اهداف لري چې له هغې څخه ډاټا راځي.

د مثال په توګه، په عملیاتي سیسټم کې، د پیرودونکي ځانګړتیا ممکن اختیاري ساحه وي. په ذخیره کې، دا خاصیت د ابعاد په توګه کارول کیدی شي او د هغې ډکول اړین دي. کوم چې په بدل کې، د ډیفالټ ارزښتونو ډکولو اړتیا معرفي کوي.

د ډیټا ذخیره کولو اړتیاوې په دوامداره توګه بدلیږي او دا معمولا د عملیاتي سیسټمونو څخه لوړ دي. مګر دا د بلې لارې شاوخوا هم کیدی شي ، کله چې په ذخیره کې د عملیاتي سیسټم څخه تفصيلي معلوماتو ذخیره کولو ته اړتیا نشته.

د دې لپاره چې د معلوماتو کیفیت اندازه شي، د دې معیارونه باید تشریح شي. هغه خلک چې د خپل کار لپاره معلومات او ارقام کاروي باید د توضیح په پروسه کې ښکیل وي. د دې ښکیلتیا پایله کیدای شي یو قاعده وي، چې په تعقیب یې یو څوک کولی شي په میز کې په یوه نظر کې ووایي چې آیا کومه تېروتنه شتون لري که نه. دا قاعده باید د راتلونکي تایید لپاره د سکریپټ/کوډ په توګه فارمیټ شي.

د معلوماتو کیفیت ښه کول

په ګودام کې د معلوماتو بارولو پروسې په جریان کې د ټولو فرضي غلطیو پاکول او سم کول ناممکن دي. د ښه معلوماتو کیفیت یوازې د ټولو ګډون کونکو ترمنځ نږدې همکارۍ له لارې ترلاسه کیدی شي. هغه خلک چې عملیاتي سیسټمونو ته معلومات داخلوي باید زده کړي چې کوم عملونه د غلطیو لامل کیږي.

د معلوماتو کیفیت یوه پروسه ده. له بده مرغه، ډیری سازمانونه د دوامداره پرمختګ لپاره ستراتیژي نلري. ډیری ځان یوازې د معلوماتو ذخیره کولو پورې محدودوي او د تحلیلي سیسټمونو بشپړ ظرفیت نه کاروي. عموما، کله چې د معلوماتو ګودامونو ته وده ورکول کیږي، د بودیجې 70-80٪ د ډیټا ادغام پلي کولو لپاره مصرف کیږي. د څارنې او ښه والي بهیر نیمګړی پاتې دی، که په هر صورت.

توکي

د سافټویر وسیلو کارول کولی شي د معلوماتو کیفیت ښه کولو او څارنې اتومات کولو پروسې کې مرسته وکړي. د مثال په توګه، دوی کولی شي د ذخیره کولو جوړښتونو تخنیکي تصدیق په بشپړه توګه اتومات کړي: د ساحې بڼه، د ډیفالټ ارزښتونو شتون، د میز ساحې نومونو سره مطابقت.

دا ممکن د مینځپانګې چک کول خورا ستونزمن وي. لکه څنګه چې د ذخیره کولو اړتیاوې بدلیږي، د معلوماتو تفسیر ممکن هم بدلون ومومي. وسیله پخپله یوه لویه پروژه کیدی شي چې ملاتړ ته اړتیا لري.

ټپ

اړونده ډیټابیسونه، په کوم کې چې پلورنځي عموما ډیزاین شوي، د لیدونو رامینځته کولو لپاره د پام وړ وړتیا لري. دوی د معلوماتو د چټک چک کولو لپاره کارول کیدی شي که تاسو د مینځپانګې ځانګړتیاوې پیژنئ. په ډیټا کې د غلطۍ یا ستونزې موندلو هره قضیه د ډیټابیس پوښتنې په بڼه ثبت کیدی شي.

په دې توګه، د منځپانګې په اړه د پوهې بنسټ به جوړ شي. البته، دا ډول غوښتنې باید چټکې وي. لیدونه معمولا د میز پراساس وسیلو په پرتله د ساتلو لپاره لږ انساني وخت ته اړتیا لري. لید تل د ازموینې پایلې ښودلو لپاره چمتو دی.
د مهمو راپورونو په صورت کې، لید ممکن د ترلاسه کونکي سره یو کالم ولري. په ګودام کې د معلوماتو کیفیت حالت په اړه راپور ورکولو لپاره د ورته BI وسیلو کارولو لپاره دا معنی لري.

بېلګه:

پوښتنه د اوریکل ډیټابیس لپاره لیکل شوې وه. په دې مثال کې، ازموینې یو شمیري ارزښت بیرته راګرځوي چې د مطلوب په توګه تشریح کیدی شي. د T_MIN او T_MAX ارزښتونه د الارم کچه تنظیمولو لپاره کارول کیدی شي. د راپور ساحه یو ځل په سوداګریز ETL محصول کې د پیغام په توګه کارول کیده چې نه پوهیدل چې څنګه په سمه توګه بریښنالیکونه لیږل کیږي، نو rpad یو "کرچ" دی.

د لوی میز په حالت کې، تاسو کولی شئ اضافه کړئ، د بیلګې په توګه، AND ROWNUM <= 10، i.e. که چیرې 10 تېروتنې شتون ولري، نو دا د الارم رامنځته کولو لپاره کافي ده.

CREATE OR REPLACE VIEW V_QC_DIM_PRODUCT_01 AS
SELECT
  CASE WHEN OUTPUT>=T_MIN AND OUTPUT<=T_MAX
  THEN 'OK' ELSE 'ERROR' END AS RESULT,
  DESCRIPTION,
  TABLE_NAME, 
  OUTPUT, 
  T_MIN,
  T_MAX,
  rpad(DESCRIPTION,60,' ') || rpad(OUTPUT,8,' ') || rpad(T_MIN,8,' ') || rpad(T_MAX,8,' ') AS REPORT
FROM (-- Test itself
  SELECT
    'DIM_PRODUCT' AS TABLE_NAME,
    'Count of blanks' AS DESCRIPTION,
    COUNT(*) AS OUTPUT,
    0 AS T_MIN,
    10 AS T_MAX
  FROM DIM_PRODUCT
  WHERE DIM_PRODUCT_ID != -1 -- not default value
  AND ATTRIBUTE IS NULL ); -- count blanks

خپرونه د کتاب له موادو څخه کار اخلي
رونالډ باچمن، ډاکټر Guido Kemper
Raus aus der BI-Falle
د سوداګرۍ استخباراتو zum Erfolg wird


سرچینه: www.habr.com

Add a comment