2018. gadÄ profesionÄļu aprindÄs un AI tematiskajÄs konferencÄs parÄdÄ«jÄs MLOps koncepcija, kas Ätri iekaroja nozarÄ un tagad attÄ«stÄs kÄ neatkarÄ«gs virziens. NÄkotnÄ MLOps var kļūt par vienu no populÄrÄkajÄm IT jomÄm. Kas tas ir un ar ko to Äd? UzzinÄsim tÄlÄk.
Kas ir MLOps
MLOps (apvienojot maŔīnmÄcÄ«bas tehnoloÄ£ijas un procesus un pieejas izstrÄdÄto modeļu ievieÅ”anai biznesa procesos) ir jauns sadarbÄ«bas veids starp biznesa pÄrstÄvjiem, zinÄtniekiem, matemÄtiÄ·iem, maŔīnmÄcÄ«bas speciÄlistiem un IT inženieriem, veidojot mÄkslÄ«gÄ intelekta sistÄmas.
Citiem vÄrdiem sakot, tas ir veids, kÄ maŔīnmÄcÄ«Å”anÄs metodes un tehnoloÄ£ijas pÄrvÄrst par noderÄ«gu rÄ«ku biznesa problÄmu risinÄÅ”anai.
Ir jÄsaprot, ka produktivitÄtes Ä·Äde sÄkas ilgi pirms modeļa izstrÄdes. TÄs pirmais solis ir definÄt biznesa problÄmu, hipotÄzi par vÄrtÄ«bu, ko var iegÅ«t no datiem, un biznesa ideju tÄs pielietoÅ”anai.
Pati MLOps koncepcija radÄs kÄ analoÄ£ija DevOps jÄdzienam saistÄ«bÄ ar maŔīnmÄcÄ«Å”anÄs modeļiem un tehnoloÄ£ijÄm. DevOps ir programmatÅ«ras izstrÄdes pieeja, kas ļauj palielinÄt atseviŔķu izmaiÅu ievieÅ”anas Ätrumu, vienlaikus saglabÄjot elastÄ«bu un uzticamÄ«bu, izmantojot vairÄkas pieejas, tostarp nepÄrtrauktu attÄ«stÄ«bu, funkciju sadalÄ«Å”anu vairÄkos neatkarÄ«gos mikropakalpojumos, automatizÄtu testÄÅ”anu un individuÄlu izvietoÅ”anu. izmaiÅas, globÄlais veselÄ«bas monitorings, ÄtrÄs reaÄ£ÄÅ”anas sistÄma atklÄtajÄm kļūmÄm u.c.
DevOps ir definÄjis programmatÅ«ras dzÄ«ves ciklu, un sabiedrÄ«ba ir nÄkusi klajÄ ar ideju piemÄrot to paÅ”u metodoloÄ£iju lielajiem datiem. DataOps ir mÄÄ£inÄjums pielÄgot un paplaÅ”inÄt metodiku, Åemot vÄrÄ liela datu apjoma uzglabÄÅ”anas, pÄrsÅ«tÄ«Å”anas un apstrÄdes iespÄjas dažÄdÄs un sadarbspÄjÄ«gÄs platformÄs.
LÄ«dz ar uzÅÄmumu biznesa procesos ieviesto maŔīnmÄcÄ«Å”anÄs modeļu noteiktas kritiskÄs masas parÄdÄ«Å”anos tika pamanÄ«ta spÄcÄ«ga lÄ«dzÄ«ba starp matemÄtisko maŔīnmÄcÄ«Å”anÄs modeļu dzÄ«ves ciklu un programmatÅ«ras dzÄ«ves ciklu. VienÄ«gÄ atŔķirÄ«ba ir tÄ, ka modeļu algoritmi tiek veidoti, izmantojot maŔīnmÄcÄ«Å”anÄs rÄ«kus un metodes. TÄpÄc dabiski radÄs ideja pielietot un pielÄgot jau zinÄmÄs programmatÅ«ras izstrÄdes pieejas maŔīnmÄcÄ«Å”anÄs modeļiem. TÄdÄjÄdi maŔīnmÄcÄ«bas modeļu dzÄ«ves ciklÄ var izdalÄ«t Å”Ädus galvenos posmus:
- biznesa idejas definÄÅ”ana;
- modeļu apmÄcÄ«ba;
- modeļa testÄÅ”ana un ievieÅ”ana biznesa procesÄ;
- modeļa darbība.
Ja darbÄ«bas laikÄ ir nepiecieÅ”ams mainÄ«t vai pÄrkvalificÄt modeli uz jauniem datiem, cikls sÄkas no jauna - modelis tiek pilnveidots, pÄrbaudÄ«ts un tiek ieviesta jauna versija.
AtkÄpties. KÄpÄc pÄrkvalificÄties un nepÄrkvalificÄties? JÄdzienam āmodeļa pÄrkvalifikÄcijaā ir divÄjÄda nozÄ«me: ekspertu vidÅ« tas nozÄ«mÄ modeļa defektu, kad modelis labi prognozÄ, faktiski atkÄrto prognozÄto parametru apmÄcÄ«bas komplektÄ, bet daudz sliktÄk darbojas ÄrÄjÄ datu paraugÄ. Protams, Å”Äds modelis ir defekts, jo Å”is defekts neļauj to izmantot.
Å ajÄ dzÄ«ves ciklÄ Å”Ä·iet loÄ£iski izmantot DevOps rÄ«kus: automatizÄtu testÄÅ”anu, izvietoÅ”anu un uzraudzÄ«bu, modeļu aprÄÄ·inu projektÄÅ”anu atseviŔķu mikropakalpojumu veidÄ. TaÄu ir arÄ« vairÄkas funkcijas, kas neļauj tieÅ”i izmantot Å”os rÄ«kus bez papildu ML saistÄ«Å”anas.
KÄ likt modeļiem strÄdÄt un gÅ«t peļÅu
KÄ piemÄru, kurÄ demonstrÄsim MLOps pieejas izmantoÅ”anu, mÄs Åemsim klasisko uzdevumu robotizÄt tÄrzÄÅ”anas atbalstu banku (vai jebkuram citam) produktam. Parasti tÄrzÄÅ”anas atbalsta biznesa process izskatÄs Å”Ädi: klients tÄrzÄÅ”anÄ ievada ziÅojumu ar jautÄjumu un saÅem atbildi no speciÄlista iepriekÅ” noteiktÄ dialoga kokÄ. Å Ädas tÄrzÄÅ”anas automatizÄcijas uzdevums parasti tiek atrisinÄts, izmantojot profesionÄli definÄtus noteikumu kopumus, kuru izstrÄde un uzturÄÅ”ana ir ļoti darbietilpÄ«ga. Å Ädas automatizÄcijas efektivitÄte atkarÄ«bÄ no uzdevuma sarežģītÄ«bas pakÄpes var bÅ«t 20ā30%. LikumsakarÄ«gi rodas doma, ka izdevÄ«gÄk ir ieviest mÄkslÄ«gÄ intelekta moduli - modeli, kas izstrÄdÄts, izmantojot maŔīnmÄcÄ«Å”anos, kas:
- spÄj apstrÄdÄt lielÄku pieprasÄ«jumu skaitu bez operatora lÄ«dzdalÄ«bas (atkarÄ«bÄ no tÄmas atseviŔķos gadÄ«jumos efektivitÄte var sasniegt 70ā80%);
- labÄk pielÄgojas nestandarta formulÄjumam dialogÄ - spÄj noteikt nolÅ«ku, lietotÄja patieso vÄlmi, pamatojoties uz nepÄrprotami formulÄtu pieprasÄ«jumu;
- zina, kÄ noteikt, kad modeļa atbilde ir adekvÄta un kad rodas Å”aubas par Ŕīs atbildes āapziÅuā un jÄuzdod papildu precizÄjoÅ”s jautÄjums vai jÄpÄrslÄdzas pie operatora;
- var papildus apmÄcÄ«t automÄtiski (tÄ vietÄ, lai izstrÄdÄtÄju grupa pastÄvÄ«gi pielÄgotu un labotu atbildes skriptus, modeli papildus apmÄca datu zinÄtnes speciÄlists, izmantojot atbilstoÅ”Äs maŔīnmÄcÄ«Å”anÄs bibliotÄkas).
KÄ panÄkt, lai Å”Äds uzlabots modelis darbotos?
TÄpat kÄ jebkuras citas problÄmas risinÄÅ”anÄ, pirms Å”Äda moduļa izstrÄdes ir nepiecieÅ”ams definÄt biznesa procesu un formÄli aprakstÄ«t konkrÄto uzdevumu, kuru risinÄsim, izmantojot maŔīnmÄcÄ«Å”anÄs metodi. Å ajÄ brÄ«dÄ« sÄkas operacionalizÄcijas process, ko apzÄ«mÄ ar akronÄ«mu Ops.
NÄkamais solis ir tas, ka Datu zinÄtnieks sadarbÄ«bÄ ar Datu inženieri pÄrbauda datu pieejamÄ«bu un pietiekamÄ«bu un biznesa hipotÄzi par biznesa idejas dzÄ«votspÄju, izstrÄdÄjot prototipa modeli un pÄrbaudot tÄ faktisko efektivitÄti. Tikai pÄc uzÅÄmuma apstiprinÄjuma var sÄkties pÄreja no modeļa izstrÄdes uz tÄ integrÄÅ”anu sistÄmÄs, kas veic noteiktu biznesa procesu. PilnÄ«ga ievieÅ”anas plÄnoÅ”ana, dziļa izpratne katrÄ posmÄ par to, kÄ modelis tiks izmantots un kÄdu ekonomisko efektu tas dos, ir bÅ«tisks punkts MLOps pieeju ievieÅ”anas procesos uzÅÄmuma tehnoloÄ£iskajÄ vidÄ.
AttÄ«stoties AI tehnoloÄ£ijÄm, eksponenciÄli pieaug to problÄmu skaits un daudzveidÄ«ba, kuras var atrisinÄt, izmantojot maŔīnmÄcÄ«Å”anos. Katrs Å”Äds biznesa process uzÅÄmumam ir ietaupÄ«jums, pateicoties masu darbinieku darba automatizÄcijai (zvanu centrs, dokumentu pÄrbaude un ŔķiroÅ”ana u.c.), tÄ ir klientu bÄzes paplaÅ”inÄÅ”ana, pievienojot jaunas pievilcÄ«gas un Ärtas funkcijas, tÄ ietaupa naudu, pateicoties optimÄlai to izmantoÅ”anai un resursu pÄrdalei un daudz ko citu. Galu galÄ jebkurÅ” process ir vÄrsts uz vÄrtÄ«bas radÄ«Å”anu, un rezultÄtÄ tam ir jÄsniedz zinÄms ekonomisks efekts. Å eit ļoti svarÄ«gi ir skaidri formulÄt biznesa ideju un aprÄÄ·inÄt sagaidÄmo peļÅu no modeļa ievieÅ”anas kopÄjÄ uzÅÄmuma vÄrtÄ«bas radÄ«Å”anas struktÅ«rÄ. Ir situÄcijas, kad modeļa ievieÅ”ana neattaisno sevi, un maŔīnmÄcÄ«bas speciÄlistu pavadÄ«tais laiks ir daudz dÄrgÄks nekÄ operatora darba vieta, kas veic Å”o uzdevumu. TÄpÄc ir jÄmÄÄ£ina identificÄt Å”Ädus gadÄ«jumus AI sistÄmu izveides sÄkumposmÄ.
LÄ«dz ar to modeļi sÄk nest peļÅu tikai tad, kad MLOps procesÄ ir pareizi formulÄta biznesa problÄma, noteiktas prioritÄtes un modeļa ievieÅ”anas process sistÄmÄ ir noformulÄts attÄ«stÄ«bas sÄkumposmÄ.
Jauns process ā jauni izaicinÄjumi
VisaptveroÅ”a atbilde uz biznesa pamatjautÄjumu par to, cik ML modeļi ir piemÄroti problÄmu risinÄÅ”anai, vispÄrÄjais jautÄjums par uzticÄÅ”anos AI ir viens no galvenajiem izaicinÄjumiem MLOps pieeju izstrÄdes un ievieÅ”anas procesÄ. SÄkotnÄji uzÅÄmÄji ir skeptiski par maŔīnmÄcÄ«bas ievieÅ”anu procesos ā grÅ«ti paļauties uz modeļiem vietÄs, kur iepriekÅ” parasti strÄdÄja cilvÄki. UzÅÄmÄjdarbÄ«bai programmas Ŕķiet āmelnÄ kasteā, kuras atbilstÄ«ba vÄl ir jÄpierÄda. TurklÄt banku jomÄ, telekomunikÄciju operatoru biznesÄ un citos ir stingras valdÄ«bas regulatoru prasÄ«bas. Visas sistÄmas un algoritmi, kas tiek ieviesti banku procesos, ir pakļauti auditam. Lai atrisinÄtu Å”o problÄmu, pierÄdÄ«tu uzÅÄmÄjiem un regulatoriem mÄkslÄ«gÄ intelekta reakciju pamatotÄ«bu un pareizÄ«bu, kopÄ ar modeli tiek ieviesti monitoringa rÄ«ki. TurklÄt pastÄv neatkarÄ«ga apstiprinÄÅ”anas procedÅ«ra, kas ir obligÄta regulÄjoÅ”iem modeļiem un atbilst CentrÄlÄs bankas prasÄ«bÄm. NeatkarÄ«ga ekspertu grupa veic modeļa iegÅ«to rezultÄtu auditu, Åemot vÄrÄ ievades datus.
Otrs izaicinÄjums ir modeļa risku novÄrtÄÅ”ana un ÅemÅ”ana vÄrÄ, ievieÅ”ot maŔīnmÄcÄ«bas modeli. Pat ja cilvÄks nevar simtprocentÄ«gi atbildÄt uz jautÄjumu, vai tÄ pati kleita bija balta vai zila, tad arÄ« mÄkslÄ«gajam intelektam ir tiesÄ«bas kļūdÄ«ties. Ir arÄ« vÄrts Åemt vÄrÄ, ka dati laika gaitÄ var mainÄ«ties, un modeļi ir jÄpÄrkvalificÄ, lai iegÅ«tu pietiekami precÄ«zu rezultÄtu. Lai biznesa process neciestu, nepiecieÅ”ams pÄrvaldÄ«t modeļu riskus un sekot lÄ«dzi modeļa veiktspÄjai, regulÄri to pÄrkvalificÄjot uz jauniem datiem.
Bet pÄc pirmÄs neuzticÄ«bas stadijas sÄk parÄdÄ«ties pretÄjs efekts. Jo vairÄk modeļu tiek veiksmÄ«gi ieviesti procesos, jo vairÄk pieaug biznesa apetÄ«te pÄc mÄkslÄ«gÄ intelekta izmantoÅ”anas ā tiek atrastas jaunas un jaunas problÄmas, kuras var atrisinÄt ar maŔīnmÄcÄ«Å”anÄs metodÄm. Katrs uzdevums aktivizÄ visu procesu, kam nepiecieÅ”amas noteiktas kompetences:
- datu inženieri sagatavo un apstrÄdÄ datus;
- datu zinÄtnieki izmanto maŔīnmÄcÄ«Å”anÄs rÄ«kus un izstrÄdÄ modeli;
- IT ievieÅ” modeli sistÄmÄ;
- ML inženieris nosaka, kÄ pareizi Å”o modeli integrÄt procesÄ, kÄdus IT rÄ«kus izmantot, atkarÄ«bÄ no modeļa pielietoÅ”anas režīma prasÄ«bÄm, Åemot vÄrÄ pieprasÄ«jumu plÅ«smu, atbildes laiku u.c.
- ML arhitekts izstrÄdÄ, kÄ programmatÅ«ras produktu var fiziski ieviest rÅ«pnieciskÄ sistÄmÄ.
Visam ciklam ir nepiecieÅ”ams liels skaits augsti kvalificÄtu speciÄlistu. NoteiktÄ ML modeļu attÄ«stÄ«bas un iespieÅ”anÄs pakÄpÄ biznesa procesos izrÄdÄs, ka speciÄlistu skaita lineÄra mÄrogoÅ”ana proporcionÄli uzdevumu skaita pieaugumam kļūst dÄrga un neefektÄ«va. LÄ«dz ar to rodas jautÄjums par MLOps procesa automatizÄciju - vairÄku maŔīnmÄcÄ«Å”anÄs problÄmu standarta klaÅ”u definÄÅ”anu, standarta datu apstrÄdes konveijeru izstrÄdi un modeļu papildu apmÄcÄ«bu. IdeÄlÄ gadÄ«jumÄ Å”Ädu problÄmu risinÄÅ”anai ir nepiecieÅ”ami profesionÄļi, kas ir vienlÄ«dz labi kompetenti lielo datu, datu zinÄtnes, DevOps un IT krustpunktÄ. TÄpÄc lielÄkÄ problÄma datu zinÄtnes nozarÄ un lielÄkais izaicinÄjums MLOps procesu organizÄÅ”anÄ ir Å”Ädas kompetences trÅ«kums esoÅ”ajÄ apmÄcÄ«bu tirgÅ«. SpeciÄlisti, kas atbilst Ŕīm prasÄ«bÄm, Å”obrÄ«d darba tirgÅ« ir reti sastopami un ir zelta vÄrti.
Par kompetenÄu jautÄjumu
TeorÄtiski visus MLOps uzdevumus var atrisinÄt, izmantojot klasiskos DevOps rÄ«kus un neizmantojot specializÄtu lomu modeļa paplaÅ”inÄjumu. Tad, kÄ jau minÄts iepriekÅ”, datu zinÄtniekam ir jÄbÅ«t ne tikai matemÄtiÄ·im un datu analÄ«tiÄ·im, bet arÄ« visa konveijera guru - viÅÅ” ir atbildÄ«gs par arhitektÅ«ras izstrÄdi, programmÄÅ”anas modeļus vairÄkÄs valodÄs atkarÄ«bÄ no arhitektÅ«ras, sagatavoÅ”anu. datu tirgus un paÅ”as lietojumprogrammas izvietoÅ”ana. TomÄr tehnoloÄ£iskÄ ietvara izveide, kas tiek ieviesta end-to-end MLOps procesÄ, aizÅem lÄ«dz pat 80% no darbaspÄka izmaksÄm, kas nozÄ«mÄ, ka kvalificÄts matemÄtiÄ·is, kas ir kvalitatÄ«vs datu zinÄtnieks, savai specialitÄtei veltÄ«s tikai 20% sava laika. . TÄpÄc ļoti svarÄ«gi kļūst maŔīnmÄcÄ«bas modeļu ievieÅ”anas procesÄ iesaistÄ«to speciÄlistu lomu noteikÅ”ana.
Tas, cik detalizÄti ir jÄnoŔķir lomas, ir atkarÄ«gs no uzÅÄmuma lieluma. TÄ ir viena lieta, ja startup ir viens speciÄlists, cÄ«tÄ«gs strÄdnieks enerÄ£ijas rezervÄ, kas ir viÅa paÅ”a inženieris, arhitekts un DevOps. Pavisam cita lieta ir tad, ja lielÄ uzÅÄmumÄ visi modeļu izstrÄdes procesi ir koncentrÄti uz dažiem augsta lÄ«meÅa datu zinÄtnes speciÄlistiem, savukÄrt programmÄtÄjs vai datubÄzes speciÄlists - darba tirgÅ« biežÄk sastopama un lÄtÄka kompetence. par lielÄko daļu darba.parastie uzdevumi.
TÄdÄjÄdi izstrÄdÄto modeļu Ätrums un kvalitÄte, komandas produktivitÄte un mikroklimats tajÄ ir tieÅ”i atkarÄ«gs no tÄ, kur ir robeža speciÄlistu atlasÄ MLOps procesa atbalstam un kÄ tiek organizÄts izstrÄdÄto modeļu operacionalizÄcijas process. .
Ko mūsu komanda jau ir paveikusi
MÄs nesen sÄkÄm veidot kompetenÄu struktÅ«ru un MLOps procesus. TaÄu mÅ«su projekti par modeļu dzÄ«ves cikla pÄrvaldÄ«bu un modeļu izmantoÅ”anu kÄ pakalpojumu jau ir MVP testÄÅ”anas stadijÄ.
MÄs arÄ« noteicÄm optimÄlo kompetenÄu struktÅ«ru lielam uzÅÄmumam un visu procesa dalÄ«bnieku mijiedarbÄ«bas organizatorisko struktÅ«ru. Tika organizÄtas veiklÄs komandas, lai risinÄtu problÄmas visam biznesa klientu lokam, un tika izveidots mijiedarbÄ«bas process ar projektu komandÄm, lai izveidotu platformas un infrastruktÅ«ru, kas ir topoÅ”Äs MLOps Äkas pamats.
JautÄjumi nÄkotnei
MLOps ir augoÅ”a joma, kurÄ trÅ«kst kompetenÄu un kas nÄkotnÄ iegÅ«s impulsu. TikmÄr vislabÄk ir balstÄ«ties uz DevOps attÄ«stÄ«bu un praksi. MLOps galvenais mÄrÄ·is ir efektÄ«vÄk izmantot ML modeļus biznesa problÄmu risinÄÅ”anai. Bet tas rada daudz jautÄjumu:
- KÄ samazinÄt modeļu palaiÅ”anas laiku ražoÅ”anÄ?
- KÄ samazinÄt birokrÄtisko berzi starp dažÄdu kompetenÄu komandÄm un palielinÄt fokusu uz sadarbÄ«bu?
- KÄ izsekot modeļus, pÄrvaldÄ«t versijas un organizÄt efektÄ«vu uzraudzÄ«bu?
- KÄ izveidot patiesi apļveida dzÄ«ves ciklu modernam ML modelim?
- KÄ standartizÄt maŔīnmÄcÄ«Å”anÄs procesu?
Atbildes uz Å”iem jautÄjumiem lielÄ mÄrÄ noteiks, cik Ätri MLOps pilnÄ«bÄ sasniegs savu potenciÄlu.
Avots: www.habr.com