Шумо бо тамоми даста мисли пештара муошират карданро оғоз мекунед, зеро прокси барои иртибот вуҷуд надорад: на менеҷери санҷиш ва на ҳамтоёни озмоишгарон.
Гирифтан ба лоиҳа бениҳоят амиқ мегардад ва шумо дар бораи ҳама ҷузъҳо, ҳам дар маҷмӯъ ва ҳам муфассал маълумот доред.
Таҳиягарон ба шумо на ҳамчун "он бачае аз озмоиш, ки чӣ кор карданашро намедонад", балки ҳамчун як шахсе, ки бо санҷишҳои автоматии худ ва интизории хатогиҳо дар як ҷузъи мушаххаси худ ба даста фоидаи бебаҳо меорад, назар мекунанд. маҳсулот.
Дар натиҷа, шумо бештар самараноктар, соҳибихтисостар ва талабот бештар ҳастед.
Бо афзоиши лоиҳа, дар 100% ҳолатҳо ман мураббии озмоишгарони нав шудам, ба онҳо таълим медодам ва донишҳоеро, ки худам омӯхтам, интиқол медиҳам. Ҳамзамон, вобаста ба лоиҳа, ман на ҳама вақт сатҳи баландтарини мутахассисони санҷиши автомобилро аз роҳбарият қабул мекардам ва зарурати омӯзонидани онҳо ба автоматизатсия (барои шахсони манфиатдор) ё асбобҳо барои истифода дар фаъолияти ҳаррӯза (асбобҳо) вуҷуд дошт. барои тавлиди маълумот ва бор кардани он ба система , асбоб барои анҷом додани санҷиши сарборӣ/санҷиши устувории “зуд” ва ғ.).
Намунаи лоиҳаи мушаххас
Мутаассифона, аз сабаби ӯҳдадориҳои ифшо накардан, ман наметавонам дар бораи лоиҳаҳое, ки дар онҳо кор кардаам, муфассал сӯҳбат кунам, аммо ман мисолҳои вазифаҳои маъмулии муҳандиси сифати маълумотро дар яке аз лоиҳаҳо хоҳам овард.
Моҳияти лоиҳа татбиқи платформаи омода кардани маълумот барои омӯзиши моделҳои омӯзиши мошинсозӣ дар асоси он мебошад. Фармоишгар як ширкати бузурги фармасевтӣ аз ИМА буд. Аз ҷиҳати техникӣ он як кластер буд Кубернитель, баланд шудан ба AWS EC2 мисолҳо, бо якчанд хидматрасонии хурд ва лоиҳаи асосии кушодаасос EPAM - легион, ба эҳтиёҷоти муштарии мушаххас мутобиқ карда шудааст (ҳоло лоиҳа аз нав таваллуд шудааст одаху). Бо истифода аз равандҳои ETL ташкил карда шуданд Ҷараёни ҳавоии Apache ва маълумот аз Salesforce системаҳои муштариён дар AWS S3 Сатилҳо. Баъдан, тасвири Docker модели омӯзиши мошин дар платформа ҷойгир карда шуд, ки дар бораи маълумоти тоза омӯхта шуда буд ва бо истифода аз интерфейси REST API пешгӯиҳоеро ба вуҷуд овард, ки барои тиҷорат ҷолиб буданд ва мушкилоти мушаххасро ҳал карданд.
Ба таври визуалӣ, ҳама чиз чунин менамуд:
Дар ин лоиҳа санҷишҳои зиёди функсионалӣ мавҷуд буданд ва бо назардошти суръати рушди хусусиятҳо ва зарурати нигоҳ доштани суръати сикли релизҳо (спринтҳои дуҳафтаина), фавран дар бораи автоматикунонии санҷиши ҷузъҳои муҳимтарини система. Аксари худи платформаи Кубернетес тавассути санҷишҳои автоматӣ фаро гирифта шудаанд Чаҳорчӯбаи робот + Python, аммо онҳоро дастгирӣ ва васеъ кардан низ лозим буд. Илова бар ин, барои роҳати муштарӣ, GUI барои идоракунии моделҳои омӯзиши мошинии дар кластер ҷойгиршуда ва инчунин қобилияти муайян кардани маълумот барои омӯзиши моделҳо дар куҷо ва дар куҷо интиқол дода мешавад, сохта шудааст. Ин иловаи васеъ ба тавсеаи санҷиши функсионалии автоматӣ оварда расонд, ки он асосан тавассути зангҳои REST API ва шумораи ками санҷишҳои 2-охири UI анҷом дода мешуд. Дар атрофи экватори ин ҳама ҳаракат ба мо як озмоишгари дастӣ ҳамроҳ шуд, ки бо санҷиши қабули версияҳои маҳсулот ва иртибот бо муштарӣ дар бораи қабули нашри навбатӣ кори аъло анҷом дод. Илова бар ин, ба сабаби омадани мутахассиси нав, мо тавонистем кори худро ҳуҷҷатгузорӣ кунем ва якчанд санҷишҳои хеле муҳими дастӣ илова кунем, ки дарҳол автоматӣ кардан душвор буд.
Ва ниҳоят, пас аз он ки мо аз платформа ва иловаи GUI устуворӣ ба даст овардем, мо ба сохтани қубурҳои ETL бо истифода аз Apache Airflow DAGs оғоз кардем. Санҷиши автоматии сифати маълумот тавассути навиштани DAG-ҳои махсуси Airflow, ки маълумотро дар асоси натиҷаҳои раванди ETL тафтиш мекард, анҷом дода шуд. Дар доираи ин лоиҳа, мо хушбахт будем ва муштарӣ ба мо дастрасӣ ба маҷмӯаҳои маълумоти беном, ки мо санҷида будем, дод. Мо сатри маълумотро барои мувофиқат бо намудҳо, мавҷудияти маълумоти шикаста, шумораи умумии сабтҳо пеш ва баъд аз он, муқоисаи тағиротҳои тавассути раванди ETL барои ҷамъоварӣ, тағир додани номи сутунҳо ва чизҳои дигар тафтиш кардем. Илова бар ин, ин чекҳо ба манбаъҳои гуногуни додаҳо, масалан, ба ғайр аз SalesForce, инчунин ба MySQL, миқёс карда шуданд.
Санҷишҳои ниҳоии сифати маълумот аллакай дар сатҳи S3 гузаронида шуда буданд, ки онҳо дар он ҷо нигоҳ дошта мешуданд ва барои омӯзиши моделҳои омӯзиши мошинсозӣ омода буданд. Барои ба даст овардани маълумот аз файли ниҳоии CSV, ки дар Bucket S3 ҷойгир аст ва тасдиқи он, бо истифода аз код навишта шудааст мизоҷони boto3.
Инчунин аз фармоишгар талаб карда шуд, ки як қисми маълумотро дар як сатили S3 ва қисми дигараш нигоҳ дорад. Ин инчунин навиштани чекҳои иловагиро барои санҷиши эътимоднокии чунин навъбандӣ талаб мекард.
Сифати маълумот як самти хеле ҷавони ояндадор аст, ки қисми он будан маънои қисми стартап буданро дорад. Як бор дар сифати маълумот шумо ба шумораи зиёди технологияҳои муосир ва серталаб ғарқ мешавед, аммо муҳимтар аз ҳама, барои шумо барои тавлид ва татбиқи ғояҳои худ имкониятҳои бузург боз хоҳанд шуд. Шумо метавонед усули такмилдиҳии пайвастаро на танҳо дар лоиҳа, балки барои худ низ истифода баред ва ҳамчун мутахассис пайваста инкишоф диҳед.