MLOps: DevOps í heimi vélanáms

Árið 2018 birtist hugmyndin um MLOps í faglegum hringjum og á þemaráðstefnum tileinkuðum gervigreind, sem tók fljótt við sér í greininni og er nú að þróast sem sjálfstæð stefna. Í framtíðinni gæti MLOps orðið eitt vinsælasta svæði í upplýsingatækni. Hvað er það og með hverju er það borðað? Við skulum komast að því hér að neðan.

MLOps: DevOps í heimi vélanáms

Hvað er MLOps

MLOps (sem sameinar vélanámstækni og ferla og nálganir til að innleiða þróuð líkön í viðskiptaferla) er ný leið til samstarfs milli fulltrúa fyrirtækja, vísindamanna, stærðfræðinga, vélanámssérfræðinga og upplýsingatækniverkfræðinga við gerð gervigreindarkerfa.

Með öðrum orðum, það er leið til að breyta vélanámsaðferðum og tækni í gagnlegt tæki til að leysa viðskiptavandamál. 

Nauðsynlegt er að skilja að framleiðnikeðjan hefst löngu fyrir þróun líkansins. Fyrsta skref þess er að skilgreina viðskiptavandamál, tilgátu um verðmæti sem hægt er að vinna úr gögnunum og viðskiptahugmynd til að beita þeim. 

Sjálft hugtakið MLOps kom upp sem hliðstæða hugmyndinni um DevOps í tengslum við vélanámslíkön og tækni. DevOps er nálgun við hugbúnaðarþróun sem gerir þér kleift að auka hraða innleiðingar einstakra breytinga en viðhalda sveigjanleika og áreiðanleika með því að nota fjölda aðferða, þar á meðal stöðuga þróun, skiptingu aðgerða í fjölda sjálfstæðra smáþjónustu, sjálfvirkar prófanir og dreifing einstakra aðferða. breytingar, alþjóðlegt heilbrigðiseftirlit, hraðviðbragðskerfi vegna bilana sem uppgötvast o.s.frv. 

DevOps hefur skilgreint líftíma hugbúnaðarins og samfélagið hefur komið með þá hugmynd að beita sömu aðferðafræði fyrir stór gögn. DataOps er tilraun til að aðlaga og auka aðferðafræðina með hliðsjón af eiginleikum geymslu, flutnings og vinnslu á miklu magni gagna á fjölbreyttum og samhæfðum kerfum.
  
Með tilkomu ákveðins gagnrýninnar massa vélanámslíkana sem innleidd voru í viðskiptaferlum fyrirtækja, varð vart við mikil líkindi á milli lífsferils stærðfræðilegra vélanámslíkana og lífsferils hugbúnaðarins. Eini munurinn er sá að líkanalgrímin eru búin til með því að nota vélanámstæki og aðferðir. Þess vegna kviknaði sú hugmynd að sjálfsögðu að beita og laga þegar þekktar aðferðir við hugbúnaðarþróun fyrir vélanámslíkön. Þannig má greina eftirfarandi lykilstig í lífsferli vélanámslíkana:

  • skilgreina viðskiptahugmynd;
  • fyrirmyndarþjálfun;
  • prófun og innleiðing líkansins í viðskiptaferlið;
  • rekstur líkansins.

Þegar þörf er á að breyta eða endurþjálfa líkanið á nýjum gögnum meðan á notkun stendur, byrjar hringrásin aftur - líkanið er betrumbætt, prófað og ný útgáfa er notuð.

hörfa. Af hverju endurmennta sig og ekki endurmennta? Hugtakið „endurmenntun líkans“ hefur tvöfalda merkingu: meðal sérfræðinga þýðir það líkangalla, þegar líkanið spáir vel fyrir, endurtekur í raun fyrirhugaða færibreytu á þjálfunarsettinu, en gengur mun verr á ytra gagnaúrtakinu. Auðvitað er slíkt líkan galli, þar sem þessi galli leyfir ekki notkun þess.

Í þessum lífsferli virðist rökrétt að nota DevOps verkfæri: sjálfvirkar prófanir, dreifing og eftirlit, hanna líkanaútreikninga í formi aðskildra örþjónustu. En það eru líka nokkrir eiginleikar sem koma í veg fyrir beina notkun þessara verkfæra án viðbótar ML-bindingar.

MLOps: DevOps í heimi vélanáms

Hvernig á að láta módel virka og vera arðbær

Sem dæmi þar sem við munum sýna fram á notkun MLOps nálgunarinnar, munum við taka hið klassíska verkefni að vélfæragerð spjallstuðning fyrir banka (eða aðra) vöru. Venjulega lítur spjallstuðningsviðskiptaferli svona út: viðskiptavinur slær inn skilaboð með spurningu í spjalli og fær svar frá sérfræðingi innan fyrirfram skilgreinds samræðutrés. Verkefnið við að gera slíkt spjall sjálfvirkt er venjulega leyst með því að nota sérfræðiskilgreindar reglur, sem er mjög vinnufrekt að þróa og viðhalda. Skilvirkni slíkrar sjálfvirkni, eftir því hversu flókið verkefnið er, getur verið 20–30%. Auðvitað kemur upp sú hugmynd að það sé arðbærara að innleiða gervigreindareiningu - líkan þróað með vélanámi, sem:

  • er fær um að vinna úr stærri fjölda beiðna án þátttöku rekstraraðila (fer eftir efni, í sumum tilfellum getur skilvirknin orðið 70–80%);
  • lagar sig betur að óstöðluðu orðalagi í samræðum - er fær um að ákvarða ásetning, raunverulega löngun notandans út frá óskýrri beiðni;
  • veit hvernig á að ákvarða hvenær svar líkansins er fullnægjandi, og þegar það eru efasemdir um "meðvitund" um þetta svar og þú þarft að spyrja frekari skýringarspurningar eða skipta yfir til rekstraraðila;
  • hægt að þjálfa það sjálfkrafa til viðbótar (í stað þess að hópur þróunaraðila sé stöðugt að aðlaga og leiðrétta svarforskriftir, er líkanið að auki þjálfað af gagnavísindasérfræðingi sem notar viðeigandi vélanámssöfn). 

MLOps: DevOps í heimi vélanáms

Hvernig á að láta svona háþróað líkan virka? 

Eins og með að leysa öll önnur vandamál, áður en þú þróar slíka einingu, er nauðsynlegt að skilgreina viðskiptaferli og lýsa formlega því tiltekna verkefni sem við munum leysa með því að nota vélanámsaðferðina. Á þessum tímapunkti hefst aðgerðaferli, sem er nefnt með skammstöfuninni Ops. 

Næsta skref er að Gagnafræðingur, í samvinnu við Gagnaverkfræðing, athugar aðgengi og nægjanleika gagna og viðskiptatilgátu um hagkvæmni viðskiptahugmyndarinnar, þróar frumgerð líkan og prófar raunverulegan virkni þess. Aðeins eftir staðfestingu frá fyrirtækinu getur umskipti frá því að þróa líkan til að samþætta það í kerfi sem framkvæma tiltekið viðskiptaferli hafist. Innleiðingaráætlun frá enda til enda, djúpur skilningur á hverju stigi á því hvernig líkanið verður notað og hvaða efnahagslegu áhrif það mun hafa, er grundvallaratriði í því ferli að innleiða MLOps nálganir í tæknilandslag fyrirtækisins.

Með þróun gervigreindartækni eykst fjöldi og fjölbreytni vandamála sem hægt er að leysa með vélanámi. Hvert slíkt viðskiptaferli er sparnaður fyrir fyrirtækið vegna sjálfvirkni í vinnu fjölda starfsmanna (símaver, athuga og flokka skjöl osfrv.), Það er stækkun viðskiptavinahópsins með því að bæta við nýjum aðlaðandi og þægilegum aðgerðum, það er sparnaður vegna hagkvæmrar nýtingar þeirra og endurdreifingar auðlinda og margt fleira. Að lokum beinist hvert ferli að því að skapa verðmæti og verður þar af leiðandi að hafa ákveðin efnahagsleg áhrif. Hér er mjög mikilvægt að móta viðskiptahugmyndina skýrt og reikna út væntanlegan hagnað af innleiðingu líkansins í heildarverðmætasköpunarskipulagi fyrirtækisins. Það eru aðstæður þegar innleiðing líkans réttlætir sig ekki og tíminn sem sérfræðingar í vélanámi eyða er miklu dýrari en vinnustaður rekstraraðilans sem sinnir þessu verkefni. Þess vegna er nauðsynlegt að reyna að bera kennsl á slík tilvik á fyrstu stigum þess að búa til gervigreindarkerfi.

Þar af leiðandi byrja líkön að skila hagnaði aðeins þegar viðskiptavandamálið hefur verið rétt mótað í MLOps ferlinu, forgangsröðun hefur verið sett og ferlið við að koma líkaninu inn í kerfið hefur verið mótað á fyrstu stigum þróunar.

Nýtt ferli - nýjar áskoranir

Yfirgripsmikið svar við grundvallarspurningunni um viðskipti um hvernig viðeigandi ML módel eru til að leysa vandamál, almenna spurningin um traust á gervigreind er ein af lykiláskorunum í því ferli að þróa og innleiða MLOps nálganir. Í upphafi eru fyrirtæki efins um innleiðingu vélanáms í ferla - það er erfitt að reiða sig á líkön á stöðum þar sem áður, að jafnaði, fólk vann. Fyrir fyrirtæki virðast forrit vera „svartur kassi“, sem enn þarf að sanna mikilvægi þess. Að auki, í bankastarfsemi, í viðskiptum fjarskiptafyrirtækja og annarra, eru strangar kröfur til eftirlitsaðila ríkisins. Öll kerfi og reiknirit sem innleidd eru í bankaferlum eru háð endurskoðun. Til að leysa þetta vandamál, til að sanna fyrir fyrirtækjum og eftirlitsaðilum réttmæti og réttmæti gervigreindarviðbragða, er verið að kynna eftirlitstæki ásamt líkaninu. Að auki er óháð löggildingarferli, lögboðið fyrir eftirlitslíkön, sem uppfyllir kröfur Seðlabankans. Óháður sérfræðingahópur endurskoðar niðurstöður sem líkanið fær með hliðsjón af inntaksgögnum.

Önnur áskorunin er að meta og taka tillit til áhættu líkana þegar vélanámslíkan er innleitt. Jafnvel þótt maður geti ekki svarað spurningunni með hundrað prósent vissu hvort sami kjóllinn hafi verið hvítur eða blár, þá á gervigreind líka rétt á að gera mistök. Það er líka þess virði að hafa í huga að gögn geta breyst með tímanum og líkön þarf að endurþjálfa til að gefa nægilega nákvæma niðurstöðu. Til að tryggja að viðskiptaferlið verði ekki fyrir skaða er nauðsynlegt að stjórna áhættum líkansins og fylgjast með frammistöðu líkansins og endurþjálfa það reglulega á nýjum gögnum.

MLOps: DevOps í heimi vélanáms

En eftir fyrsta stig vantrausts byrja öfug áhrif að koma fram. Því fleiri líkön sem tekist er að innleiða í ferla, því meiri matarlyst fyrirtækis fyrir notkun gervigreindar vex - ný og ný vandamál eru að finna sem hægt er að leysa með vélrænum aðferðum. Hvert verkefni hrindir af stað heilu ferli sem krefst ákveðinnar hæfni:

  • gagnaverkfræðingar undirbúa og vinna úr gögnum;
  • gagnafræðingar nota vélanámstæki og þróa líkan;
  • IT innleiðir líkanið inn í kerfið;
  • ML verkfræðingur ákvarðar hvernig á að samþætta þetta líkan rétt í ferlið, hvaða upplýsingatæknitæki á að nota, allt eftir kröfum um notkunarmáta líkansins, að teknu tilliti til flæðis beiðna, viðbragðstíma o.s.frv. 
  • ML arkitekt hannar hvernig hægt er að útfæra hugbúnaðarvöru líkamlega í iðnaðarkerfi.

Öll hringrásin krefst fjölda mjög hæfra sérfræðinga. Á ákveðnum tímapunkti í þróun og skarpskyggni ML líkana inn í viðskiptaferla kemur í ljós að línulega skalning á fjölda sérfræðinga í hlutfalli við fjölgun verkefna verður dýr og árangurslaus. Þess vegna vaknar spurningin um að gera MLOps ferlið sjálfvirkt - skilgreina nokkra staðlaða flokka vélanámsvandamála, þróa staðlaðar gagnavinnsluleiðslur og viðbótarþjálfun á gerðum. Í hugsjón mynd krefst þess að leysa slík vandamál fagfólk sem er jafn hæft í hæfni á mótum Big Data, Data Science, DevOps og IT. Þess vegna er stærsta vandamálið í gagnavísindaiðnaðinum og stærsta áskorunin við að skipuleggja MLOps ferla skortur á slíkri hæfni á núverandi þjálfunarmarkaði. Sérfræðingar sem uppfylla þessar kröfur eru fátíðir á vinnumarkaði um þessar mundir og eru gulls ígildi.

Um hæfnismál

Fræðilega séð er hægt að leysa öll MLOps verkefni með klassískum DevOps verkfærum og án þess að grípa til sérhæfðrar framlengingar á fyrirmyndinni. Síðan, eins og við tókum fram hér að ofan, verður gagnafræðingur að vera ekki aðeins stærðfræðingur og gagnafræðingur, heldur einnig sérfræðingur í allri leiðslunni - hann er ábyrgur fyrir að þróa arkitektúrinn, forrita líkön á nokkrum tungumálum eftir arkitektúrnum, undirbúa gagnaverslun og dreifðu forritinu sjálfu. Hins vegar tekur allt að 80% af launakostnaði að búa til tæknilega rammann sem innleiddur er í MLOps ferlinu, sem þýðir að hæfur stærðfræðingur, sem er vandaður gagnafræðingur, mun aðeins verja 20% af tíma sínum í sérgrein sína. . Þess vegna verður mikilvægt að afmarka hlutverk sérfræðinga sem taka þátt í því að innleiða vélanámslíkön. 

Hversu ítarlega ætti að afmarka hlutverkin fer eftir stærð fyrirtækisins. Það er eitt þegar sprotafyrirtæki er með einn sérfræðing, vinnumann í orkuforðanum, sem er hans eigin verkfræðingur, arkitekt og DevOps. Það er allt annað mál þegar í stóru fyrirtæki eru öll módelþróunarferli einbeitt hjá fáum háþróuðum sérfræðingum í gagnafræði, en forritari eða gagnagrunnssérfræðingur - algengari og ódýrari hæfni á vinnumarkaði - getur tekið á flestum vinnu.. venjubundin verkefni.

Þannig fer hraði og gæði þróuðu líkananna, framleiðni teymisins og örloftslagið í því beint eftir því hvar mörkin liggja í vali á sérfræðingum til að styðja við MLOps ferlið og hvernig ferlið við rekstur þróuðu líkananna er skipulagt. .

Það sem liðið okkar hefur þegar gert

Við byrjuðum nýlega að byggja upp hæfniskipulag og MLOps ferla. En verkefni okkar um líftímastjórnun líkana og notkun líkana sem þjónustu eru nú þegar á MVP prófunarstigi.

Við ákváðum einnig ákjósanlega hæfniskipulag fyrir stórt fyrirtæki og skipulag samspils allra þátttakenda í ferlinu. Skipulögð teymi voru skipulögð til að leysa vandamál fyrir allan hóp viðskiptavina og var komið á samskiptaferli við verkefnateymi til að búa til vettvang og innviði, sem er grunnurinn að MLOps byggingunni sem er í byggingu.

Spurningar til framtíðar

MLOps er vaxandi svið sem býr við skortur á hæfni og mun öðlast skriðþunga í framtíðinni. Í millitíðinni er best að byggja á DevOps þróun og venjum. Meginmarkmið MLOps er að nota ML módel á skilvirkari hátt til að leysa viðskiptavandamál. En þetta vekur upp margar spurningar:

  • Hvernig á að stytta tímann til að setja módel í framleiðslu?
  • Hvernig á að draga úr skrifræðisnúningi milli teyma með mismunandi hæfni og auka áherslu á samvinnu?
  • Hvernig á að rekja líkön, stjórna útgáfum og skipuleggja skilvirkt eftirlit?
  • Hvernig á að búa til sannarlega hringlaga líftíma fyrir nútíma ML líkan?
  • Hvernig á að staðla vélanámsferlið?

Svörin við þessum spurningum munu að miklu leyti ráða því hversu fljótt MLOps ná fullum möguleikum.

Heimild: www.habr.com

Bæta við athugasemd