Агуулахад байгаа мэдээллийн чанар

Агуулахад байгаа мэдээллийн чанар нь үнэ цэнэтэй мэдээлэл олж авах чухал урьдчилсан нөхцөл юм. Муу чанар нь урт хугацаанд сөрөг гинжин урвалд хүргэдэг.
Нэгдүгээрт, өгсөн мэдээлэлд итгэх итгэл алдагдсан. Хүмүүс Бизнесийн тагнуулын программуудыг бага ашиглаж эхэлж байгаа бөгөөд програмын боломжууд нь тодорхойгүй хэвээр байна.
Үүний үр дүнд аналитик төслийн цаашдын хөрөнгө оруулалт эргэлзээтэй болж байна.

Өгөгдлийн чанарыг хариуцах

Өгөгдлийн чанарыг сайжруулахтай холбоотой тал нь BI төслүүдэд маш чухал юм. Гэхдээ энэ нь зөвхөн техникийн мэргэжилтнүүдийн давуу эрх биш юм.
Мэдээллийн чанарт мөн адил хүчин зүйлс нөлөөлдөг

Байгууллагын соёл

  • Ажилчид өөрсдөө сайн чанартай бүтээгдэхүүн үйлдвэрлэх сонирхолтой юу?
  • Үгүй бол яагаад болохгүй гэж? Ашиг сонирхлын зөрчил үүсч магадгүй.
  • Чанарыг хэн хариуцахыг тодорхойлдог корпорацийн дүрэм байдаг болов уу?

Үйл явц

  • Эдгээр гинжин хэлхээний төгсгөлд ямар өгөгдөл үүсдэг вэ?
  • Магадгүй үйлдлийн системүүд нь бодит байдал дээр энэ эсвэл бусад нөхцөл байдлыг тусгахын тулд "мушгих" хэрэгтэй байхаар тохируулагдсан байж магадгүй юм.
  • Үйлдлийн системүүд өгөгдөл баталгаажуулах, нэгтгэх ажлыг өөрсдөө хийдэг үү?

Тайлангийн систем дэх мэдээллийн чанарыг байгууллагын хүн бүр хариуцдаг.

Тодорхойлолт ба утга

Чанар гэдэг нь хэрэглэгчийн хүлээлтийг баталгаажуулсан сэтгэл ханамж юм.

Гэхдээ өгөгдлийн чанарт тодорхойлолт байдаггүй. Энэ нь үргэлж хэрэглээний нөхцөл байдлыг тусгадаг. Өгөгдлийн агуулах болон BI систем нь өгөгдөл ирдэг үйлдлийн системээс өөр зорилготой.

Жишээлбэл, үйлдлийн систем дээр хэрэглэгчийн шинж чанар нь нэмэлт талбар байж болно. Хадгалах газарт энэ шинж чанарыг хэмжээс болгон ашиглаж болох бөгөөд үүнийг бөглөх шаардлагатай. Энэ нь эргээд анхдагч утгуудыг бөглөх хэрэгцээг танилцуулж байна.

Өгөгдөл хадгалах шаардлага байнга өөрчлөгдөж байдаг бөгөөд тэдгээр нь ихэвчлэн үйлдлийн системүүдийнхээс өндөр байдаг. Гэхдээ үйлдлийн системээс дэлгэрэнгүй мэдээллийг санах ойд хадгалах шаардлагагүй үед энэ нь эсрэгээрээ байж болно.

Өгөгдлийн чанарыг хэмжиж болохуйц болгохын тулд түүний стандартыг тодорхойлсон байх ёстой. Мэдээлэл, тоо баримтыг ажилдаа ашигладаг хүмүүсийг дүрслэх үйл явцад оролцуулах ёстой. Энэ оролцооны үр дүн нь дүрэм байж болох бөгөөд үүнийг дагаж мөрдвөл алдаа байгаа эсэхийг ширээн дээр хараад л мэдэж болно. Энэ дүрмийг дараагийн баталгаажуулалтын скрипт/код болгон форматлах ёстой.

Өгөгдлийн чанарыг сайжруулах

Агуулахад өгөгдөл ачаалах явцад гарсан бүх таамаглалын алдааг цэвэрлэж, засах боломжгүй юм. Өгөгдлийн сайн чанарт зөвхөн бүх оролцогчдын нягт хамтын ажиллагааны үр дүнд хүрэх боломжтой. Үйлдлийн системд өгөгдөл оруулдаг хүмүүс ямар үйлдэл алдаад хүргэдэгийг мэдэх хэрэгтэй.

Өгөгдлийн чанар бол процесс юм. Харамсалтай нь олон байгууллагад тасралтгүй сайжруулах стратеги байдаггүй. Ихэнх нь зөвхөн өгөгдөл хадгалах замаар өөрсдийгөө хязгаарлаж, аналитик системийн бүрэн боломжийг ашигладаггүй. Ерөнхийдөө мэдээллийн агуулахыг хөгжүүлэхэд төсвийн 70-80% нь мэдээллийн интеграцчлалыг хэрэгжүүлэхэд зарцуулагддаг. Хяналт-шинжилгээ, сайжруулах үйл явц нь бүрэн бус хэвээр байна.

Хэрэгсэл

Програм хангамжийн хэрэгслийг ашиглах нь мэдээллийн чанарыг сайжруулах, хянах үйл явцыг автоматжуулахад тусална. Жишээлбэл, тэд хадгалах байгууламжийн техникийн баталгаажуулалтыг бүрэн автоматжуулж чадна: талбарын формат, анхдагч утгууд байгаа эсэх, хүснэгтийн талбарын нэрсийн нийцэл.

Агуулгыг шалгах нь илүү хэцүү байж магадгүй юм. Хадгалалтын шаардлага өөрчлөгдөхийн хэрээр өгөгдлийн тайлбар бас өөрчлөгдөж болно. Энэ хэрэгсэл нь өөрөө дэмжлэг шаарддаг асар том төсөл болж чадна.

Зөвлөгөө

Дэлгүүрүүдийг ихэвчлэн зохион бүтээдэг харилцааны мэдээллийн сан нь үзэл бодлыг бий болгох гайхалтай чадвартай байдаг. Хэрэв та агуулгын онцлогийг мэддэг бол тэдгээрийг хурдан шуурхай шалгахад ашиглаж болно. Өгөгдөл дэх алдаа, асуудлыг олсон тохиолдол бүрийг мэдээллийн сангийн асуулга хэлбэрээр бүртгэж болно.

Ингэж байж агуулгын талаарх мэдлэгийн бааз бий болно. Мэдээжийн хэрэг, ийм хүсэлт хурдан байх ёстой. Хүснэгтэд суурилсан хэрэгслүүдийг бодвол харагдацыг засварлахад хүний ​​цаг хугацаа бага шаардагддаг. Туршилтын үр дүнг харуулахад үргэлж бэлэн байдаг.
Чухал тайлангийн хувьд харагдац нь хүлээн авагчтай багана агуулж болно. Агуулахад байгаа өгөгдлийн чанарын төлөв байдлын талаар мэдээлэхийн тулд ижил BI хэрэгслийг ашиглах нь утга учиртай юм.

Жишээ нь:

Асуулга нь Oracle мэдээллийн санд зориулагдсан болно. Энэ жишээнд тестүүд нь хүссэнээр тайлбарлаж болох тоон утгыг буцаадаг. T_MIN ба T_MAX утгыг дохиоллын түвшинг тохируулахад ашиглаж болно. REPORT талбарыг нэг удаа арилжааны ETL бүтээгдэхүүнд мессеж болгон ашигладаг байсан бөгөөд имэйлийг хэрхэн зөв илгээхээ мэдэхгүй байсан тул rpad нь "таяг" юм.

Том хүснэгтийн хувьд та жишээ нь AND ROWNUM <= 10, i.e. хэрэв 10 алдаа байгаа бол энэ нь түгшүүр төрүүлэхэд хангалттай.

CREATE OR REPLACE VIEW V_QC_DIM_PRODUCT_01 AS
SELECT
  CASE WHEN OUTPUT>=T_MIN AND OUTPUT<=T_MAX
  THEN 'OK' ELSE 'ERROR' END AS RESULT,
  DESCRIPTION,
  TABLE_NAME, 
  OUTPUT, 
  T_MIN,
  T_MAX,
  rpad(DESCRIPTION,60,' ') || rpad(OUTPUT,8,' ') || rpad(T_MIN,8,' ') || rpad(T_MAX,8,' ') AS REPORT
FROM (-- Test itself
  SELECT
    'DIM_PRODUCT' AS TABLE_NAME,
    'Count of blanks' AS DESCRIPTION,
    COUNT(*) AS OUTPUT,
    0 AS T_MIN,
    10 AS T_MAX
  FROM DIM_PRODUCT
  WHERE DIM_PRODUCT_ID != -1 -- not default value
  AND ATTRIBUTE IS NULL ); -- count blanks

Уг хэвлэлд номны материалыг ашигласан болно
Рональд Бахманн, Доктор. Гидо Кемпер
Raus aus der BI-Falle
Wie Business Intelligence zum Erfolg wird


Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх