لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

ټولو ته سلام، زما نوم الکساندر دی، او زه د ډیټا کیفیت انجینر یم چې د کیفیت لپاره ډاټا ګوري. دا مقاله به پدې اړه وغږیږي چې زه څنګه دې ته راغلم او ولې په 2020 کې د ازموینې دا ساحه د څپې په سر کې وه.

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

نړیوال رجحان

نن ورځ نړۍ د یو بل ټیکنالوژیک انقلاب سره مخ ده، چې یو اړخ یې د ټولو ډولونو شرکتونو لخوا د راټول شوي ډیټا کارول دي ترڅو د دوی د پلور، ګټې او PR فلای ویل وګرځوي. داسې بریښي چې دا د ښه (کیفیت) ډیټا شتون دی ، او همدارنګه مهارت لرونکي مغزونه چې کولی شي له دوی څخه پیسې وګټي (په سمه توګه پروسس کول ، لید کول ، د ماشین زده کړې ماډلونه جوړول او نور) ، نن ورځ د ډیری لپاره د بریا کلیدي ګرځیدلي. که 15-20 کاله دمخه، لوی شرکتونه په عمده توګه د معلوماتو راټولولو او د دوی د پیسو مینځلو سره په جدي کار کې ښکیل وو، نن ورځ دا د نږدې ټولو هوښیارو خلکو ډیری برخه ده.

پدې اړه ، څو کاله دمخه ، په ټوله نړۍ کې د کار لټون ټول پورټلونه د ډیټا ساینس پوهانو خالي ځایونو سره ډکیدل پیل کړل ، ځکه چې هرڅوک ډاډه و چې په خپلو کارمندانو کې د داسې متخصص په ترلاسه کولو سره ، دوی کولی شي د ماشین زده کړې عالي ماډل رامینځته کړي ، د راتلونکي وړاندوینې. او د شرکت لپاره "کوانټم جمپ" جوړ کړئ. د وخت په تیریدو سره، خلکو پوه شو چې دا طریقه تقریبا هیڅکله کار نه کوي، ځکه چې د ټولو معلوماتو څخه لرې چې د داسې متخصصینو لاس ته راځي د روزنې ماډلونو لپاره مناسب دي.

او د ډیټا ساینس پوهانو غوښتنې پیل شوې: "راځئ چې له دې او دوی څخه نور ډیټا واخلو ..." ، "موږ کافي ډیټا نلرو ..." ، "موږ یو څه نور ډیټا ته اړتیا لرو او په غوره توګه لوړ کیفیت ...". د دې غوښتنو پراساس ، د شرکتونو ترمینځ ډیری تعاملات رامینځته شوي چې د ډیټا یو یا بل سیټ لري. په طبیعي توګه، دا د دې پروسې تخنیکي سازمان ته اړتیا درلوده - د معلوماتو سرچینې سره وصل کول، ډاونلوډ کړئ، وګورئ چې دوی په بشپړ ډول بار شوي، او داسې نور. د دې ډول پروسو شمیر وده پیل کړه، او نن ورځ موږ بل ډول ته ډیره اړتیا لرو. د متخصصینو - د معلوماتو کیفیت انجنیران - هغه څوک چې په سیسټم کې د ډیټا جریان څارنه کوي (د ډیټا پایپ لاینونه)، د معلوماتو کیفیت په داخل او تولید کې، د دوی د کفایت، بشپړتیا او نورو ځانګړتیاوو په اړه پایلې ترلاسه کوي.

د انجینرانو د ډیټا کیفیت لپاره رجحان موږ ته د متحده ایالاتو څخه راغلی ، چیرې چې د پانګوالي دورې په جریان کې ، هیڅ څوک چمتو ندي چې د معلوماتو لپاره جګړه له لاسه ورکړي. لاندې ما په متحده ایالاتو کې د دوه خورا مشهور د کار لټون سایټونو څخه سکرین شاټونه چمتو کړي دي: www.monster.com и www.dice.com - کوم چې د 17 مارچ 2020 پورې د ترلاسه شوي پوسټونو شمیر په اړه معلومات ښیې ، د کلیدي کلمو لپاره: د ډیټا کیفیت او ډیټا ساینس پوه.

www.monster.com

د معلوماتو ساینس پوهانو - 21416 خالي بستونه
د معلوماتو کیفیت - 41104 خالي بستونه

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه
لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

www.dice.com

د معلوماتو ساینس پوهانو - 404 خالي بستونه
د معلوماتو کیفیت - 2020 خالي ځایونه

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه
لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

په ښکاره ډول، دا مسلکونه په هیڅ ډول د یو بل سره سیالي نه کوي. د سکرین شاټونو سره، ما یوازې غوښتل د کار بازار کې اوسنی وضعیت د ډیټا کیفیت انجنیرانو لپاره د غوښتنو په اساس روښانه کړم، کوم چې اوس د ډیټا ساینس پوهانو په پرتله خورا ډیر اړین دي.

د 2019 په جون کې، EPAM، د عصري معلوماتي ټکنالوجۍ بازار اړتیاوو ته ځواب ووایه، د ډیټا کیفیت د جلا تمرین په توګه وټاکه. د ډیټا کیفیت انجینران د دوی د ورځني کار په جریان کې ډیټا اداره کوي ، په نوي شرایطو او سیسټمونو کې د هغې چلند ګوري ، د ډیټا مطابقت کنټرولوي ، د هغې کفایت او تړاو. د دې ټولو سره ، په عملي معنی کې ، د ډیټا کیفیت انجینران واقعیا د کلاسیک فعالیت ازموینې ته لږ وخت وقف کوي ، خو دا په کلکه په پروژه پورې اړه لري (زه به لاندې مثال ورکړم).

د ډیټا کیفیت انجینر دندې په ډیټابیس جدولونو کې د "نولونو ، شمیرو او مقدارونو" لپاره د معمول لارښود / اتوماتیک چیکونو پورې محدود ندي ، مګر د پیرودونکي سوداګرۍ اړتیاو ژورې پوهاوي ته اړتیا لري او په وینا یې د موجوده ډیټا بدلولو وړتیا ته اړتیا لري. د کارونې وړ سوداګرۍ معلومات.

د معلوماتو کیفیت تیوري

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

د دې لپاره چې د داسې انجینر رول په بشپړ ډول تصور کړئ ، راځئ چې معلومه کړو چې د ډیټا کیفیت په تیوري کې څه دی.

د ډاټا کیفیت - د ډیټا مدیریت یو له مرحلو څخه (ټوله نړۍ چې موږ به تاسو ته د خپلواکې مطالعې لپاره پریږدو) او د لاندې معیارونو سره سم د معلوماتو تحلیل مسؤلیت لري:

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه
زه فکر کوم چې دا د هرې نقطې درک کولو ارزښت نلري (په تیوري کې دوی د "ډاټا ابعاد" په نوم یادیږي)، دوی په انځور کې خورا ښه تشریح شوي. مګر د ازموینې پروسه پخپله د ازموینې قضیو او د دوی تصدیق کې د دې ځانګړتیاو سخت کاپي کولو معنی نلري. د ډیټا کیفیت کې، لکه د بل هر ډول ازموینې په څیر، دا اړینه ده چې لومړی د ډیټا کیفیت اړتیاوې رامینځته کړي چې د پروژې برخه اخیستونکو سره موافقه شوي چې د سوداګرۍ پریکړې کوي.

د ډیټا کیفیت پروژې پورې اړه لري ، انجینر کولی شي مختلف دندې ترسره کړي: د عادي ټیسټر - اتوماتیک څخه د ډیټا کیفیت سطحي ارزونې سره هغه کس ته چې د پورتنیو معیارونو سره سم د دوی ژور پروفایل ترسره کوي.

د ډیټا مدیریت، د معلوماتو کیفیت او اړونده پروسو خورا مفصل توضیحات په یوه کتاب کې په ښه توګه تشریح شوي "DAMA-DMBOK: د معلوماتو مدیریت د پوهې څانګه: دویمه نسخه". زه دا کتاب د دې موضوع د پیژندنې په توګه وړاندیز کوم (تاسو به د مقالې په پای کې د دې لپاره لینک ومومئ).

زما کیسه

د معلوماتي ټکنالوجۍ په صنعت کې، زه د محصول شرکتونو کې د جونیر QA څخه په EPAM کې د ډیټا کیفیت انجنیر ته تللی یم. د ټیسټر په توګه شاوخوا دوه کاله وروسته ، ما په کلکه باور درلود چې ما په بشپړ ډول د ازموینې ټول ډولونه ترسره کړي: راجسټریشن ، فعاله ، فشار ، ثبات ، امنیت ، UI او نور - او د ازموینې ډیری وسیلې هڅه کړې ، په داسې حال کې چې کار کاوه. درې پروګرامینګ ژبې: جاوا، سکالا، پیتون.

شاته کتل، زه پوهیږم چې ولې زما د مهارت سیټ خورا متفاوت دی - زه د ډیټا پروژو کې ښکیل شوی یم، لوی او کوچني. دا هغه څه دي چې ما د ودې لپاره د ډیری وسیلو او فرصتونو نړۍ ته راوړي.

د نوي پوهې او مهارتونو د ترلاسه کولو لپاره د مختلفو وسیلو او فرصتونو ستاینه کولو لپاره، یوازې لاندې انځور وګورئ، کوم چې د "ډیټا او AI" په نړۍ کې د دوی ترټولو مشهور ښیي.

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه
دا ډول بیلګه هر کال د یو مشهور پانګوال پانګوال Matt Turck لخوا تولید کیږي، د سافټویر پراختیا اصلي ځای دی. دلته لینک د هغه بلاګ او د پانګونې شرکتچیرې چې هغه د ملګري په توګه کار کوي.

زه په مسلکي توګه په ځانګړي توګه په چټکۍ سره وده وموم کله چې زه په پروژه کې یوازینی ټیسټر وم، یا لږترلږه د پروژې په پیل کې. دا په دې وخت کې دی چې تاسو باید د ازموینې ټولې پروسې لپاره مسؤل اوسئ ، او تاسو د شاته کیدو هیڅ فرصت نلرئ ، یوازې مخکې. په لومړي سر کې دا ډارونکی و، مګر اوس د داسې ازموینې ټولې ګټې زما لپاره روښانه دي:

  • تاسو د ټول ټیم ​​سره اړیکه پیل کړئ لکه مخکې چې هیڅکله نه وي، ځکه چې د اړیکو لپاره هیڅ پراکسي شتون نلري: نه د ازموینې مدیر او نه هم ملګري ازموینه.
  • په پروژه کې ډوبیدل په زړه پورې ډول ژور کیږي، او تاسو په عمومي او تفصیل کې د ټولو برخو په اړه معلومات لرئ.
  • پرمخ وړونکي تاسو ته د "هغه ټیسټ هلک په توګه نه ګوري چې نه پوهیږي هغه څه کوي" ، بلکه د یو مساوي په توګه ، د ټیم لپاره د هغه د آټوټسټس او په ځانګړي محصول نوډ کې د کیګونو وړاندوینې سره د نه منلو وړ ارزښت تولیدوي.
  • د پایلې په توګه، تاسو ډیر اغیزمن، ډیر وړ، په تقاضا کې ډیر یاست.

لکه څنګه چې پروژه وده وکړه، په سلو کې 100 قضیو کې زه د نویو ازموینو لپاره لارښود شوم چې دې ته راغلل، دوی ته یې درس ورکړ او هغه پوهه یې انتقال کړه چې ما پخپله زده کړې وه. په ورته وخت کې، د پروژې پورې اړه لري، ما تل د مدیریت څخه د آټو ټیسټ متخصصینو لوړه کچه نه ده ترلاسه کړې او اړتیا وه چې یا به دوی په اتوماتیک کې وروزل شي (د هغو کسانو لپاره چې غواړي)، یا د دوی لخوا د کارولو لپاره وسایل جوړ کړي. په ورځني فعالیتونو کې (د ډیټا تولیدولو او سیسټم ته د بارولو لپاره وسیلې، د بار ازموینې / چټک ثبات ازموینې ترسره کولو لپاره وسیله، او داسې نور).

د یوې ځانګړې پروژې بیلګه

له بده مرغه، د نه افشاء کولو مکلفیتونو له امله، زه نشم کولی د هغو پروژو په اړه په تفصیل سره خبرې وکړم چې ما کار کړی، مګر زه به په یوه پروژه کې د ډیټا کیفیت انجینر د عادي کارونو مثالونه وړاندې کړم.

د پروژې جوهر د ماشین زده کړې ماډلونو پراساس د روزنې لپاره د معلوماتو چمتو کولو لپاره یو پلیټ فارم پلي کول دي. پیرودونکی د متحده ایالاتو څخه د درملو لوی شرکت و. په تخنیکي توګه دا یو کلستر و کوبنیټسته لوړیږي د AWS EC2 مثالونه، د ډیری مایکرو خدماتو او د EPAM څخه د خلاصې سرچینې پروژې سره - له شماره وتلی، د یو ځانګړي پیرودونکي اړتیاو سره تطابق شوی (اوس پروژه بیا رامینځته شوې odahu). د ETL پروسې په کارولو سره تنظیم شوي د اپاچي هوا جریان او له دې څخه ډاټا لیږدول د پلور توکي د پیرودونکو سیسټمونو کې AWS S3 سطلونه بیا ، د ماشین زده کړې ماډل یو ډاکر عکس پلیټ فارم ته ځای په ځای شوی و ، کوم چې په تازه معلوماتو کې روزل شوی و او د REST API انٹرفیس په کارولو سره یې وړاندوینې خپرې کړې چې د سوداګرۍ لپاره په زړه پوري وې او ځانګړي ستونزې یې حل کړې.

په لید کې، دا یو څه داسې ښکاري:

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه
په دې پروژه کې ډیری فعالې ازموینې شتون درلود، او د ځانګړتیاوو پراختیا سرعت او د خوشې کولو دورې سرعت ساتلو اړتیا ته په پام سره (دوه اونۍ سپریټونه)، دا اړینه وه چې سمدستي د خورا مهم سیسټم نوډونو اتوماتیک ازموینې په اړه فکر وکړئ. . د Kubernetes-based پلیټ فارم ډیری برخه پخپله د اتوماتیک ازموینې لخوا پوښل شوي چې پلي شوي د روبوټ چوکاټ + پایتون ، مګر دوی هم ملاتړ او غزولو ته اړتیا لري. برسېره پردې، د پیرودونکي اسانتیا لپاره، یو GUI د ماشین زده کړې ماډلونو اداره کولو لپاره رامینځته شوی چې په کلستر کې ګمارل شوي، په بیله بیا د مشخص کولو وړتیا چې د ماډل روزنې لپاره د معلوماتو لیږدولو لپاره له کوم ځای څخه او چیرته لیږدول کیږي. دا پراخه اضافه د اتوماتیک فعال چیکونو پراختیا ته اړتیا لري، کوم چې ډیری یې د REST API کالونو او د پای 2 پای UI ازموینې لږ شمیر له لارې ترسره شوي. د دې ټول حرکت د استوا په شاوخوا کې، یو لاسي ټیسټر زموږ سره یوځای شو، چا چې د محصول نسخو منلو ازموینې او د راتلونکي خوشې کیدو منلو په اړه د پیرودونکي سره د خبرو اترو سره عالي دنده ترسره کړه. سربیره پردې، د نوي متخصص د راتګ له امله، موږ وکولای شو خپل کار مستند کړو او ځینې خورا مهم لارښود چیکونه اضافه کړو چې سمدلاسه اتومات کول ستونزمن وو.

او په نهایت کې ، وروسته له هغه چې موږ د پلیټ فارم څخه ثبات ترلاسه کړ او پدې کې د GUI اضافه کول ، موږ د اپاچي ایر فلو DAGs په کارولو سره د ETL پایپ لاینونو جوړول پیل کړل. د اتوماتیک ډیټا کیفیت چیک د ځانګړي هوایی فلو DAGs لیکلو سره ترسره شو چې د ETL پروسې پایلو پراساس ډیټا چیک کړي. د دې پروژې د یوې برخې په توګه، موږ خوشحاله یو، او پیرودونکي موږ ته د نامعلومو معلوماتو سیټونو ته لاسرسی راکړ، په کوم کې چې موږ ازموینه وکړه. موږ د ډول موافقت لپاره د لاین په واسطه د ډیټا لاین چیک کړ ، د مات شوي ډیټا شتون ، مخکې او وروسته د ریکارډونو مجموعه ، د راټولولو لپاره د ETL پروسې لخوا ترسره شوي بدلونونو پرتله کول ، د کالم نومونه بدلول ، او داسې نور. برسېره پردې، دا چکونه د مختلفو معلوماتو سرچینو ته اندازه شوي، د بیلګې په توګه، د SalesForce سربیره، په MySQL کې هم.

د وروستي معلوماتو کیفیت چکونه دمخه د S3 په کچه ترسره شوي، چیرته چې دوی زیرمه شوي او د ماشین زده کړې ماډلونو روزنې لپاره د کارولو لپاره چمتو حالت کې وو. د وروستي CSV فایل څخه ډاټا ترلاسه کولو لپاره چې په S3 بالټ کې موقعیت لري او تصدیق یې کړي، یو کوډ په کارولو سره لیکل شوی و. boto3 پیرودونکي.

همدارنګه د پیرودونکي په برخه کې اړتیا وه چې د معلوماتو یوه برخه په S3 بالټ کې ذخیره کړي، او په بل کې برخه. دا د اضافي چکونو لیکلو ته هم اړتیا لري چې د دې ډول ترتیب کولو اعتبار کنټرولوي.

په نورو پروژو کې عمومي تجربه

د ډیټا کیفیت انجینر د فعالیتونو خورا عمومي لیست یوه بیلګه:

  • د اتوماتیک وسیلې له لارې د ازموینې ډاټا چمتو کړئ (د اعتبار وړ لوی لوی کوچنی).
  • چمتو شوي ډیټاسیټ اصلي سرچینې ته پورته کړئ او د کارولو لپاره یې چمتووالی وګورئ.
  • د ETL پروسې پیل کړئ د سرچینې ذخیره کولو څخه وروستي یا منځګړی ته د ډیټا سیټ پروسس کولو لپاره د ترتیباتو یو ټاکلی سیټ په کارولو سره (که امکان ولري ، د ETL دندې لپاره د تنظیم وړ پیرامیټونه تنظیم کړئ).
  • د ETL پروسې لخوا پروسس شوي معلومات د دې کیفیت او د سوداګرۍ اړتیاو سره مطابقت لپاره تایید کړئ.

په ورته وخت کې ، د چکونو اصلي تمرکز باید نه یوازې پدې حقیقت باندې وي چې په سیسټم کې د معلوماتو جریان ، په اصولو کې ، کار شوی او پای ته رسیدلی (کوم چې د فعال ازموینې برخه ده) ، مګر د ډیری برخې لپاره. د متوقع غوښتنو سره مطابقت لپاره د معلوماتو چک کول او اعتبار کول، د ګډوډۍ پیژندل او نور شیان.

توکي

د دې ډول معلوماتو کنټرول لپاره یو له تخنیکونو څخه د ډیټا پروسس کولو په هر مرحله کې د زنځیر چیکونو تنظیم کیدی شي ، په ادبياتو کې د "ډیټا زنځیر" په نوم یادیږي - د سرچینې څخه د وروستي کارونې نقطې پورې د معلوماتو کنټرول. دا ډول چکونه اکثرا د تصدیق کولو SQL پوښتنو په لیکلو سره پلي کیږي. دا روښانه ده چې دا ډول پوښتنې باید د امکان تر حده لږ وزن ولري او د ډیټا کیفیت انفرادي برخې چیک کړئ (میزونه میټاډاټا، خالي کرښې، NULLs، په ترکیب کې تېروتنې - نور ځانګړتیاوې چې چک کولو ته اړتیا لري).

د ریګریشن ازموینې په حالت کې ، کوم چې چمتو شوي (بدل شوي ، یو څه بدل شوي) ډیټا سیټونه کاروي ، د اتوماتیک کوډ کولی شي د کیفیت سره موافقت لپاره ډیټا چیک کولو لپاره چمتو شوي ټیمپلیټونه زیرمه کړي (د تمه شوي میز میټاډاټا توضیحات؛ د تار نمونې توکي چې کیدی شي په تصادفي ډول د ازموینې په جریان کې غوره شوی، او داسې نور).

همچنان ، د ازموینې پرمهال ، تاسو باید د چوکاټونو په کارولو سره د ازموینې ETL پروسې ولیکئ لکه د اپاچي ایر فلو ، اپاپي سپارک یا حتی د تور بکس کلاوډ وسیله لکه د GCP ډیټاپریپ, د GCP ډیټا فلو او همداسی پسی. دا حالت د ازموینې انجینر ته اړوي چې د پورتنیو وسیلو د عملیاتو اصولو کې ډوب کړي او حتی په مؤثره توګه دواړه فعاله ازموینې ترسره کړي (د مثال په توګه ، په پروژه کې د ETL پروسې شتون لري) او د معلوماتو چک کولو لپاره یې کاروي. په ځانګړې توګه، د اپاچي ایر فلو د مشهور تحلیلي ډیټابیسونو سره کار کولو لپاره چمتو شوي آپریټرونه لري، د بیلګې په توګه GCP BigQuery. د دې کارولو ترټولو اساسي مثال لا دمخه بیان شوی. دلتهنو زه به خپل ځان تکرار نه کړم.

د چمتو شوي حلونو سربیره، هیڅوک تاسو د خپل تخنیکونو او وسایلو پلي کولو څخه منع نه کوي. دا به نه یوازې د پروژې لپاره، بلکې پخپله د ډیټا کیفیت انجنیر لپاره هم ګټور وي، چې په دې توګه به د هغه تخنیکي لید او کوډ کولو مهارتونه ښه کړي.

دا څنګه په ریښتینې پروژه کې کار کوي

د "ډیټا چین" په اړه د وروستي پراګرافونو ښه مثال، ETL او هر اړخیز چکونه د یوې اصلي پروژې څخه لاندې پروسه ده:

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

دلته، مختلف معلومات (په طبیعي توګه، زموږ لخوا چمتو شوي) زموږ د سیسټم ان پټ "فنل" ته ننوځي: معتبر، ناباوره، مخلوط، او نور، بیا دوی فلټر شوي او منځمهاله ذخیره ته ځي، بیا دوی بیا د یو لړ لړۍ لخوا انتظار کیږي. بدلونونه او په وروستي ذخیره کې ځای پر ځای شوي، چې په پایله کې به یې د تحلیلونو، د ډیټا مارټونو جوړولو او د سوداګرۍ بصیرت لټون لپاره کارول کیږي. په داسې یو سیسټم کې، موږ پرته له دې چې په فعاله توګه د ETL پروسو کار وڅیړو، د بدلونونو دمخه او وروسته د معلوماتو کیفیت، او همدارنګه د تحلیلاتو تولید باندې تمرکز وکړو.

د پورتني لنډیز لپاره، د هغه ځایونو په پام کې نیولو پرته چې ما کار کړی، هرچیرې زه د ډیټا پروژو کې ښکیل وم چې لاندې ځانګړتیاوې یې یوځای کړې:

  • یوازې د اتومات کولو له لارې ځینې قضیې ازمول کیدی شي او د سوداګرۍ لپاره د منلو وړ خوشې کولو دوره ترلاسه کیدی شي.
  • په داسې پروژه کې ټیسټر د ټیم یو له خورا درناوي غړو څخه دی ، ځکه چې دا د هر ګډون کونکي لپاره عالي ګټې راوړي (د ازموینې ګړندی کول ، د ډیټا ساینس پوه ډیټا ښه کول ، د نیمګړتیاو دمخه کشف).
  • دا مهمه نده چې تاسو په خپل هارډویر یا بادل کې کار کوئ - ټولې سرچینې په کلستر کې خلاصې شوي لکه هورټون ورکس، کلاوډرا، میسوس، کوبرنیټس، او نور.
  • پروژې د مایکرو سرویس طریقې باندې جوړې شوي، ویشل شوي او موازي کمپیوټري غالب دي.

زه یادونه کوم کله چې د ډیټا کیفیت په ساحه کې ازموینه کیږي ، یو ټیسټر خپل مسلکي تمرکز د محصول کوډ او کارول شوي وسیلو ته واړوي.

د ډیټا کیفیت ازموینې ځانګړي ځانګړتیاوې

برسېره پردې، د ځان لپاره، ما لاندې پیژندلي دي (زه به سمدلاسه یو ریزرویشن خورا عمومي او خورا موضوعي کړم) د ډیټا (لوی ډیټا) پروژو (سیسټمونو) او نورو برخو کې د ازموینې ځانګړي ځانګړتیاوې:

لوی او کوچني ډیټا ټیسټر: رجحانات ، تیوري ، زما کیسه

ګټور لینکونه

  1. نظریه: DAMA-DMBOK: د معلوماتو مدیریت د پوهې څانګه: دویمه نسخه.
  2. روزنیز مرکز EPAM 
  3. د پیل کونکي ډیټا کیفیت انجینر لپاره وړاندیز شوي توکي:
    1. په Stepik کې وړیا کورس: د ډیټابیسونو پیژندنه
    2. د لینکډین زده کړې کورس: د ډیټا ساینس بنسټونه: د ډیټا انجینرۍ.
    3. مقالې:
    4. ویډیو:

پایلې

د ډاټا کیفیت یو ډیر ځوان امید لرونکی لار ده، د یوې برخې کیدو معنی د پیل کولو برخه ده. یوځل د ډیټا کیفیت کې ، تاسو به د ډیری عصري غوښتنې ټیکنالوژیو کې ډوب شئ ، مګر ترټولو مهم ، تاسو به د خپلو نظرونو تولید او پلي کولو لپاره لوی فرصتونه ولرئ. تاسو به وکولی شئ د دوامداره پرمختګ طریقه وکاروئ نه یوازې په پروژه کې ، بلکه د ځان لپاره هم ، په دوامداره توګه د متخصص په توګه وده کول.

سرچینه: www.habr.com

Add a comment