MLOps: DevOps yn y byd Dysgu Peiriannau

Yn 2018, ymddangosodd y cysyniad o MLOps mewn cylchoedd proffesiynol ac mewn cynadleddau thematig ymroddedig i AI, a gydiodd yn gyflym yn y diwydiant ac sydd bellach yn datblygu fel cyfeiriad annibynnol. Yn y dyfodol, efallai y bydd MLOps yn dod yn un o'r meysydd mwyaf poblogaidd ym maes TG. Beth ydyw a beth i'w fwyta gydag ef? Dewch i ni ddarganfod isod.

MLOps: DevOps yn y byd Dysgu Peiriannau

Beth yw MLOps

Mae MLOps (sy’n cyfuno technolegau dysgu peirianyddol a phrosesau a dulliau o roi modelau datblygedig ar waith yn brosesau busnes) yn ffordd newydd o gydweithio rhwng cynrychiolwyr busnes, gwyddonwyr, mathemategwyr, arbenigwyr dysgu peiriannau a pheirianwyr TG wrth greu systemau deallusrwydd artiffisial.

Mewn geiriau eraill, mae'n ffordd o droi dulliau dysgu peiriannau a thechnolegau yn arf defnyddiol ar gyfer datrys problemau busnes. 

Mae angen deall bod y gadwyn cynhyrchiant yn dechrau ymhell cyn datblygu'r model. Ei gam cyntaf yw diffinio problem fusnes, rhagdybiaeth am y gwerth y gellir ei dynnu o'r data, a syniad busnes ar gyfer ei gymhwyso. 

Cododd yr union gysyniad o MLOps fel cyfatebiaeth i'r cysyniad o DevOps mewn perthynas â modelau a thechnolegau dysgu peiriannau. Mae DevOps yn ddull o ddatblygu meddalwedd sy'n eich galluogi i gynyddu cyflymder gweithredu newidiadau unigol tra'n cynnal hyblygrwydd a dibynadwyedd gan ddefnyddio nifer o ddulliau, gan gynnwys datblygiad parhaus, rhannu swyddogaethau yn nifer o ficrowasanaethau annibynnol, profi awtomataidd a defnyddio gwasanaethau unigol. newidiadau, monitro iechyd byd-eang, system ymateb cyflym ar gyfer methiannau a ganfuwyd, ac ati. 

Mae DevOps wedi diffinio cylch bywyd meddalwedd, ac mae'r gymuned wedi meddwl am y syniad o gymhwyso'r un fethodoleg i ddata mawr. Mae DataOps yn ymgais i addasu ac ehangu'r fethodoleg gan ystyried nodweddion storio, trosglwyddo a phrosesu llawer iawn o ddata mewn llwyfannau amrywiol a rhyngweithredol.
  
Gyda dyfodiad màs critigol penodol o fodelau dysgu peiriant ar waith ym mhrosesau busnes mentrau, sylwyd ar debygrwydd cryf rhwng cylch bywyd modelau dysgu peiriannau mathemategol a chylch bywyd meddalwedd. Yr unig wahaniaeth yw bod yr algorithmau model yn cael eu creu gan ddefnyddio offer a dulliau dysgu peirianyddol. Felly, cododd y syniad yn naturiol i gymhwyso ac addasu dulliau hysbys eisoes o ddatblygu meddalwedd ar gyfer modelau dysgu peiriannau. Felly, gellir gwahaniaethu rhwng y cyfnodau allweddol canlynol yng nghylch bywyd modelau dysgu peiriannau:

  • diffinio syniad busnes;
  • hyfforddiant model;
  • profi a gweithredu'r model yn y broses fusnes;
  • gweithrediad y model.

Pan fydd angen newid neu ailhyfforddi'r model ar ddata newydd yn ystod y llawdriniaeth, mae'r cylch yn ailddechrau - caiff y model ei fireinio, ei brofi, a defnyddir fersiwn newydd.

Encilio. Pam ailhyfforddi a pheidio ag ailhyfforddi? Mae gan y term “ailhyfforddi model” ystyr dwbl: ymhlith arbenigwyr mae'n golygu diffyg model, pan fydd y model yn rhagweld yn dda, mewn gwirionedd yn ailadrodd y paramedr a ragwelir ar y set hyfforddi, ond yn perfformio'n waeth o lawer ar y sampl data allanol. Yn naturiol, mae model o'r fath yn ddiffyg, gan nad yw'r diffyg hwn yn caniatáu ei ddefnyddio.

Yn y cylch bywyd hwn, mae'n ymddangos yn rhesymegol defnyddio offer DevOps: profi, defnyddio a monitro awtomataidd, dylunio cyfrifiadau model ar ffurf microwasanaethau ar wahân. Ond mae yna hefyd nifer o nodweddion sy'n atal defnydd uniongyrchol o'r offer hyn heb rwymo ML ychwanegol.

MLOps: DevOps yn y byd Dysgu Peiriannau

Sut i wneud i fodelau weithio a bod yn broffidiol

Fel enghraifft lle byddwn yn dangos y defnydd o ddull MLOps, byddwn yn cymryd y dasg glasurol o roboteiddio cefnogaeth sgwrsio ar gyfer cynnyrch bancio (neu unrhyw gynnyrch arall). Yn nodweddiadol, mae proses fusnes cymorth sgwrsio yn edrych fel hyn: mae cleient yn mynd i mewn i neges gyda chwestiwn mewn sgwrs ac yn derbyn ymateb gan arbenigwr o fewn coeden ddeialog wedi'i diffinio ymlaen llaw. Mae'r dasg o awtomeiddio sgwrs o'r fath fel arfer yn cael ei datrys gan ddefnyddio setiau o reolau wedi'u diffinio'n arbenigol, sy'n llafurddwys iawn i'w datblygu a'u cynnal. Gall effeithlonrwydd awtomeiddio o'r fath, yn dibynnu ar lefel cymhlethdod y dasg, fod yn 20-30%. Yn naturiol, mae'r syniad yn codi ei bod yn fwy proffidiol gweithredu modiwl deallusrwydd artiffisial - model a ddatblygwyd gan ddefnyddio dysgu peiriant, sydd:

  • yn gallu prosesu nifer fwy o geisiadau heb gyfranogiad gweithredwr (yn dibynnu ar y pwnc, mewn rhai achosion gall yr effeithlonrwydd gyrraedd 70-80%);
  • yn addasu'n well i eiriad ansafonol mewn deialog - yn gallu pennu'r bwriad, gwir awydd y defnyddiwr yn seiliedig ar gais nad yw wedi'i lunio'n glir;
  • yn gwybod sut i benderfynu pryd mae ateb y model yn ddigonol, a phan fo amheuon ynghylch “ymwybyddiaeth” yr ateb hwn a bod angen i chi ofyn cwestiwn egluro ychwanegol neu newid i'r gweithredwr;
  • gellir ei hyfforddi'n awtomatig ychwanegol (yn lle grŵp o ddatblygwyr yn addasu ac yn cywiro sgriptiau ymateb yn gyson, mae'r model yn cael ei hyfforddi hefyd gan arbenigwr Gwyddor Data gan ddefnyddio'r llyfrgelloedd dysgu peirianyddol priodol). 

MLOps: DevOps yn y byd Dysgu Peiriannau

Sut i wneud i fodel mor ddatblygedig weithio? 

Fel gyda datrys unrhyw broblem arall, cyn datblygu modiwl o'r fath, mae angen diffinio proses fusnes a disgrifio'n ffurfiol y dasg benodol y byddwn yn ei datrys gan ddefnyddio'r dull dysgu peiriant. Ar y pwynt hwn, mae'r broses o weithredu, a ddynodwyd gan yr acronym Ops, yn dechrau. 

Y cam nesaf yw bod y Gwyddonydd Data, mewn cydweithrediad â'r Peiriannydd Data, yn gwirio argaeledd a digonolrwydd data a'r ddamcaniaeth busnes ynghylch hyfywedd y syniad busnes, gan ddatblygu model prototeip a phrofi ei effeithiolrwydd gwirioneddol. Dim ond ar ôl cadarnhad gan y busnes y gall y newid o ddatblygu model i'w integreiddio i systemau sy'n cyflawni proses fusnes benodol ddechrau. Mae cynllunio gweithredu o'r dechrau i'r diwedd, dealltwriaeth ddofn ar bob cam o sut y bydd y model yn cael ei ddefnyddio a pha effaith economaidd a ddaw yn ei sgil, yn bwynt sylfaenol yn y broses o gyflwyno dulliau MLOps i dirwedd dechnolegol y cwmni.

Gyda datblygiad technolegau AI, mae nifer ac amrywiaeth y problemau y gellir eu datrys trwy ddefnyddio dysgu peiriannau yn cynyddu'n esbonyddol. Mae pob proses fusnes o'r fath yn arbediad i'r cwmni oherwydd awtomeiddio llafur gweithwyr torfol (canolfan alwadau, gwirio a didoli dogfennau, ac ati), mae'n ehangu sylfaen y cleient trwy ychwanegu swyddogaethau deniadol a chyfleus newydd, mae'n yn arbed arian oherwydd eu defnydd gorau ac ailddosbarthu adnoddau a llawer mwy. Yn y pen draw, mae unrhyw broses yn canolbwyntio ar greu gwerth ac, o ganlyniad, rhaid iddi ddod ag effaith economaidd benodol. Yma mae'n bwysig iawn llunio'r syniad busnes yn glir a chyfrifo'r elw disgwyliedig o weithredu'r model yn strwythur creu gwerth cyffredinol y cwmni. Mae yna sefyllfaoedd pan nad yw gweithredu model yn cyfiawnhau ei hun, ac mae'r amser a dreulir gan arbenigwyr dysgu peiriannau yn llawer drutach na gweithle'r gweithredwr sy'n cyflawni'r dasg hon. Dyna pam mae angen ceisio nodi achosion o'r fath yn y camau cynnar o greu systemau AI.

O ganlyniad, dim ond pan fydd y broblem fusnes wedi'i llunio'n gywir yn y broses MLOps y mae modelau'n dechrau cynhyrchu elw, mae blaenoriaethau wedi'u pennu, ac mae'r broses o gyflwyno'r model i'r system wedi'i llunio yn y camau datblygu cynnar.

Proses newydd - heriau newydd

Ateb cynhwysfawr i'r cwestiwn busnes sylfaenol ynghylch pa mor berthnasol yw modelau ML i ddatrys problemau, mater cyffredinol ymddiriedaeth mewn AI yw un o'r heriau allweddol yn y broses o ddatblygu a gweithredu dulliau MLOps. I ddechrau, mae busnesau'n amheus ynghylch cyflwyno dysgu peirianyddol i brosesau - mae'n anodd dibynnu ar fodelau mewn mannau lle'r oedd pobl, fel rheol, yn gweithio o'r blaen. Ar gyfer busnes, mae rhaglenni'n ymddangos yn “blwch du”, ac mae angen profi eu perthnasedd o hyd. Yn ogystal, mewn bancio, ym musnes gweithredwyr telathrebu ac eraill, mae gofynion llym rheoleiddwyr y llywodraeth. Mae'r holl systemau ac algorithmau a weithredir mewn prosesau bancio yn destun archwiliad. I ddatrys y broblem hon, er mwyn profi dilysrwydd a chywirdeb ymatebion deallusrwydd artiffisial i fusnes a rheoleiddwyr, mae offer monitro yn cael eu cyflwyno ynghyd â'r model. Yn ogystal, mae gweithdrefn ddilysu annibynnol, sy'n orfodol ar gyfer modelau rheoleiddio, sy'n bodloni gofynion y Banc Canolog. Mae grŵp arbenigol annibynnol yn archwilio'r canlyniadau a geir gan y model gan ystyried y data mewnbwn.

Yr ail her yw asesu ac ystyried risgiau model wrth weithredu model dysgu peirianyddol. Hyd yn oed os na all person ateb y cwestiwn gyda sicrwydd gant y cant a oedd yr un ffrog yn wyn neu'n las, yna mae gan ddeallusrwydd artiffisial yr hawl i wneud camgymeriad hefyd. Mae hefyd yn werth ystyried y gall data newid dros amser, ac mae angen ailhyfforddi modelau er mwyn cynhyrchu canlyniad digon cywir. Er mwyn sicrhau nad yw'r broses fusnes yn dioddef, mae angen rheoli risgiau model a monitro perfformiad y model, gan ei ailhyfforddi'n rheolaidd ar ddata newydd.

MLOps: DevOps yn y byd Dysgu Peiriannau

Ond ar ôl cam cyntaf diffyg ymddiriedaeth, mae'r effaith groes yn dechrau ymddangos. Po fwyaf o fodelau sy’n cael eu gweithredu’n llwyddiannus mewn prosesau, y mwyaf y bydd awydd busnes i ddefnyddio deallusrwydd artiffisial yn tyfu - mae problemau newydd a newydd yn cael eu canfod y gellir eu datrys gan ddefnyddio dulliau dysgu peirianyddol. Mae pob tasg yn sbarduno proses gyfan sy'n gofyn am rai cymwyseddau:

  • mae peirianwyr data yn paratoi ac yn prosesu data;
  • mae gwyddonwyr data yn defnyddio offer dysgu peirianyddol ac yn datblygu model;
  • Mae TG yn rhoi'r model ar waith yn y system;
  • Mae'r peiriannydd ML yn penderfynu sut i integreiddio'r model hwn yn gywir i'r broses, pa offer TG i'w defnyddio, yn dibynnu ar y gofynion ar gyfer dull cymhwyso'r model, gan ystyried llif y ceisiadau, amser ymateb, ac ati. 
  • Mae pensaer ML yn dylunio sut y gellir gweithredu cynnyrch meddalwedd yn gorfforol mewn system ddiwydiannol.

Mae'r cylch cyfan yn gofyn am nifer fawr o arbenigwyr cymwys iawn. Ar adeg benodol yn natblygiad a graddau treiddiad modelau ML i brosesau busnes, mae'n ymddangos bod graddio nifer yr arbenigwyr yn llinol yn gymesur â'r cynnydd yn nifer y tasgau yn dod yn ddrud ac yn aneffeithiol. Felly, mae'r cwestiwn yn codi o awtomeiddio'r broses MLOps - diffinio sawl dosbarth safonol o broblemau dysgu peiriannau, datblygu piblinellau prosesu data safonol a hyfforddiant ychwanegol o fodelau. Mewn darlun delfrydol, mae datrys problemau o'r fath yn gofyn am weithwyr proffesiynol sydd yr un mor hyfedr mewn cymwyseddau ar groesffordd Data Mawr, Gwyddor Data, DevOps a TG. Felly, y broblem fwyaf yn y diwydiant Gwyddor Data a'r her fwyaf wrth drefnu prosesau MLOps yw diffyg cymhwysedd o'r fath yn y farchnad hyfforddi bresennol. Ar hyn o bryd mae arbenigwyr sy'n bodloni'r gofynion hyn yn brin ar y farchnad lafur ac yn werth eu pwysau mewn aur.

Ar fater cymwyseddau

Mewn egwyddor, gellir datrys holl dasgau MLOps gan ddefnyddio offer DevOps clasurol a heb droi at estyniad arbenigol o'r model rôl. Yna, fel y nodwyd uchod, mae'n rhaid i wyddonydd data fod nid yn unig yn fathemategydd a dadansoddwr data, ond hefyd yn guru y biblinell gyfan - ef sy'n gyfrifol am ddatblygu'r bensaernïaeth, rhaglennu modelau mewn sawl iaith yn dibynnu ar y bensaernïaeth, paratoi marchnad ddata a lleoli'r rhaglen ei hun. Fodd bynnag, mae creu'r fframwaith technolegol a weithredir yn y broses MLOps o'r dechrau i'r diwedd yn cymryd hyd at 80% o gostau llafur, sy'n golygu y bydd mathemategydd cymwys, sy'n Wyddonydd Data o safon, yn neilltuo dim ond 20% o'i amser i'w arbenigedd. . Felly, mae'n hanfodol nodi rolau arbenigwyr sy'n ymwneud â'r broses o roi modelau dysgu peirianyddol ar waith. 

Mae pa mor fanwl y dylid amlinellu'r rolau yn dibynnu ar faint y fenter. Mae'n un peth pan fydd gan gwmni cychwynnol un arbenigwr, gweithiwr caled yn y gronfa ynni wrth gefn, sef ei beiriannydd, pensaer a DevOps ei hun. Mae'n fater hollol wahanol pan fydd yr holl brosesau datblygu model, mewn menter fawr, yn canolbwyntio ar ychydig o arbenigwyr Gwyddor Data lefel uchel, tra gall rhaglennydd neu arbenigwr cronfa ddata - cymhwysedd mwy cyffredin a llai costus yn y farchnad lafur - gymryd ar y rhan fwyaf o'r gwaith, tasgau arferol.

Felly, mae cyflymder ac ansawdd y modelau datblygedig, cynhyrchiant y tîm a'r microhinsawdd ynddo yn dibynnu'n uniongyrchol ar ble mae'r ffin yn gorwedd wrth ddewis arbenigwyr i gefnogi'r broses MLOps a sut mae'r broses o weithredu'r modelau datblygedig yn cael ei threfnu. .

Yr hyn y mae ein tîm eisoes wedi'i wneud

Yn ddiweddar dechreuon ni adeiladu strwythur cymhwysedd a phrosesau MLOps. Ond mae ein prosiectau ar reoli cylch bywyd model ac ar ddefnyddio modelau fel gwasanaeth eisoes yn y cam profi MVP.

Fe wnaethom hefyd bennu'r strwythur cymhwysedd optimaidd ar gyfer menter fawr a strwythur sefydliadol y rhyngweithio rhwng yr holl gyfranogwyr yn y broses. Trefnwyd timau ystwyth i ddatrys problemau ar gyfer yr ystod gyfan o gwsmeriaid busnes, a sefydlwyd proses o ryngweithio â thimau prosiect i greu llwyfannau a seilwaith, sef sylfaen yr adeilad MLOps sy'n cael ei adeiladu.

Cwestiynau ar gyfer y dyfodol

Mae MLOps yn faes cynyddol sy'n profi prinder cymwyseddau a bydd yn ennill momentwm yn y dyfodol. Yn y cyfamser, mae'n well adeiladu ar ddatblygiadau ac arferion DevOps. Prif nod MLOps yw defnyddio modelau ML yn fwy effeithiol i ddatrys problemau busnes. Ond mae hyn yn codi llawer o gwestiynau:

  • Sut i leihau'r amser i lansio modelau i gynhyrchu?
  • Sut i leihau ffrithiant biwrocrataidd rhwng timau o wahanol gymwyseddau a chynyddu'r ffocws ar gydweithredu?
  • Sut i olrhain modelau, rheoli fersiynau a threfnu monitro effeithiol?
  • Sut i greu cylch bywyd gwirioneddol gylchol ar gyfer model ML modern?
  • Sut i safoni'r broses dysgu peiriant?

Bydd yr atebion i'r cwestiynau hyn yn pennu i raddau helaeth pa mor gyflym y bydd MLOps yn cyrraedd eu llawn botensial.

Ffynhonnell: hab.com

Ychwanegu sylw