It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Ibbażat fuq id-diskorsi tiegħi f'Highload++ u DataFest Minsk 2019.

Għal ħafna llum, il-posta hija parti integrali mill-ħajja online. Bl-għajnuna tagħha, aħna nwettqu korrispondenza kummerċjali, naħżnu kull tip ta 'informazzjoni importanti relatata mal-finanzi, prenotazzjonijiet ta' lukandi, ordnijiet u ħafna aktar. F'nofs l-2018, ifformulajna strateġija tal-prodott għall-iżvilupp tal-posta. Kif għandha tkun il-posta moderna?

Il-posta trid tkun intelliġenti, jiġifieri, tgħin lill-utenti jinnavigaw il-volum dejjem jikber ta 'informazzjoni: iffiltra, struttura u tipprovdiha bl-aktar mod konvenjenti. Hija trid tkun utli, li jippermettilek issolvi diversi kompiti dritt fil-kaxxa tal-posta tiegħek, pereżempju, tħallas multi (funzjoni li, sfortunatament, nuża). U fl-istess ħin, ovvjament, il-posta trid tipprovdi protezzjoni tal-informazzjoni, taqta' l-ispam u tipproteġi kontra l-hacking, jiġifieri, tkun bla periklu.

Dawn l-oqsma jiddefinixxu numru ta 'problemi ewlenin, li ħafna minnhom jistgħu jiġu solvuti b'mod effettiv bl-użu ta' tagħlim bil-magni. Hawn huma eżempji ta 'karatteristiċi diġà eżistenti żviluppati bħala parti mill-istrateġija - wieħed għal kull direzzjoni.

  • Tweġiba Intelliġenti. Il-posta għandha karatteristika ta' tweġiba intelliġenti. In-netwerk newrali janalizza t-test tal-ittra, jifhem it-tifsira u l-iskop tagħha, u bħala riżultat joffri t-tliet għażliet ta 'rispons l-aktar xierqa: pożittiv, negattiv u newtrali. Dan jgħin biex jiffranka l-ħin b'mod sinifikanti meta jwieġeb l-ittri, u wkoll spiss jirrispondu b'mod mhux standard u umoristiku.
  • Raggruppament ta' emailsrelatati ma’ ordnijiet fi ħwienet onlajn. Ħafna drabi nixtru onlajn, u, bħala regola, il-ħwienet jistgħu jibagħtu diversi emails għal kull ordni. Pereżempju, minn AliExpress, l-akbar servizz, ħafna ittri jidħlu għal ordni waħda, u kkalkulajna li fil-każ tat-terminal in-numru tagħhom jista 'jilħaq sa 29. Għalhekk, bl-użu tal-mudell ta' Rikonoxximent tal-Entità Ismijiet, aħna estratt in-numru tal-ordni u informazzjoni oħra mit-test u grupp l-ittri kollha f'ħajt wieħed. Aħna nuru wkoll informazzjoni bażika dwar l-ordni f'kaxxa separata, li tagħmilha aktar faċli biex taħdem ma 'dan it-tip ta' email.

    It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

  • Antiphishing. Il-phishing huwa tip ta’ email frawdolenti partikolarment perikoluż, li bl-għajnuna tiegħu l-attakkanti jippruvaw jiksbu informazzjoni finanzjarja (inklużi l-karti tal-bank tal-utent) u logins. Ittri bħal dawn jimitaw dawk reali mibgħuta mis-servizz, inkluż viżwalment. Għalhekk, bl-għajnuna ta’ Computer Vision, nagħrfu l-logos u l-istil tad-disinn ta’ ittri minn kumpaniji kbar (pereżempju, Mail.ru, Sber, Alfa) u nqisu dan flimkien mat-test u karatteristiċi oħra fil-klassifikaturi tagħna tal-ispam u l-phishing. .

Tagħlim bil-magna

Ftit dwar it-tagħlim tal-magni fl-email b'mod ġenerali. Il-posta hija sistema mgħobbija ħafna: medja ta' 1,5 biljun ittra kuljum jgħaddu mis-servers tagħna għal 30 miljun utent DAU. Madwar 30 sistema ta 'tagħlim tal-magni jappoġġjaw il-funzjonijiet u l-karatteristiċi kollha meħtieġa.

Kull ittra tgħaddi minn pipeline ta' klassifikazzjoni kollu. L-ewwel naqtgħu l-ispam u nħallu emails tajbin. L-utenti ħafna drabi ma jinnutawx ix-xogħol tal-antispam, minħabba li 95-99% tal-ispam lanqas biss jispiċċa fil-folder xieraq. Ir-rikonoxximent tal-ispam huwa parti importanti ħafna mis-sistema tagħna, u l-aktar diffiċli, peress li fil-qasam tal-anti-spam hemm adattament kostanti bejn is-sistemi ta 'difiża u attakk, li jipprovdi sfida ta' inġinerija kontinwa għat-tim tagħna.

Sussegwentement, nisseparaw ittri minn nies u robots. L-emails min-nies huma l-aktar importanti, għalhekk nipprovdu karatteristiċi bħal Smart Reply għalihom. Ittri minn robots huma maqsuma f'żewġ partijiet: transazzjonali - dawn huma ittri importanti minn servizzi, pereżempju, konfermi ta 'xiri jew riżervi ta' lukandi, finanzi, u informattivi - dawn huma reklamar tan-negozju, skontijiet.

Aħna nemmnu li l-emails transazzjonali huma ugwali fl-importanza tal-korrispondenza personali. Għandhom ikunu fil-idejn, għax ħafna drabi għandna bżonn insibu malajr informazzjoni dwar ordni jew riservazzjoni ta 'biljetti tal-ajru, u nqattgħu ħin infittxu dawn l-ittri. Għalhekk, għall-konvenjenza, aħna awtomatikament naqsmuhom f'sitt kategoriji ewlenin: ivvjaġġar, ordnijiet, finanzi, biljetti, reġistrazzjonijiet u, finalment, multi.

L-ittri ta 'informazzjoni huma l-akbar grupp u probabbilment inqas importanti, li ma jeħtiġux rispons immedjat, peress li xejn sinifikanti ma jinbidel fil-ħajja tal-utent jekk ma jaqrax tali ittra. Fl-interface l-ġdida tagħna, aħna nikkollassawhom f'żewġ ħjut: netwerks soċjali u newsletters, u b'hekk inaddfu viżwalment l-inbox u nħallu biss messaġġi importanti viżibbli.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Isfruttament

Numru kbir ta 'sistemi jikkawża ħafna diffikultajiet fit-tħaddim. Wara kollox, il-mudelli jiddegradaw maż-żmien, bħal kull softwer: il-karatteristiċi jkissru, il-magni jfallu, il-kodiċi jsir mgħawweġ. Barra minn hekk, id-dejta qed tinbidel kontinwament: oħrajn ġodda jiżdiedu, il-mudelli tal-imġieba tal-utent jiġu trasformati, eċċ., Għalhekk mudell mingħajr appoġġ xieraq se jaħdem agħar u agħar maż-żmien.

Ma rridux ninsew li aktar ma t-tagħlim tal-magni jippenetra fil-fond fil-ħajja tal-utenti, akbar ikun l-impatt li għandhom fuq l-ekosistema, u, bħala riżultat, aktar telf finanzjarju jew profitti jistgħu jirċievu l-atturi tas-suq. Għalhekk, f'numru dejjem jikber ta 'oqsma, il-plejers qed jadattaw għax-xogħol tal-algoritmi ML (eżempji klassiċi huma r-reklamar, it-tfittxija u l-antispam diġà msemmi).

Barra minn hekk, il-kompiti tat-tagħlim tal-magni għandhom partikolarità: kwalunkwe bidla, anki minuri, fis-sistema tista 'tiġġenera ħafna xogħol mal-mudell: xogħol bid-dejta, taħriġ mill-ġdid, skjerament, li jista' jieħu ġimgħat jew xhur. Għalhekk, aktar ma jinbidel malajr l-ambjent li fih joperaw il-mudelli tiegħek, aktar jeħtieġ sforz biex jinżammu. Tim jista 'joħloq ħafna sistemi u jkun kuntent bihom, iżda mbagħad jonfoq kważi r-riżorsi kollha tiegħu biex iżommhom, mingħajr l-opportunità li jagħmel xi ħaġa ġdida. Darba ltqajna ma’ sitwazzjoni bħal din fit-tim antispam. U għamlu l-konklużjoni ovvja li l-appoġġ jeħtieġ li jiġi awtomatizzat.

Awtomazzjoni

X'jista' jiġi awtomatizzat? Kważi kollox, fil-fatt. Identifikajt erba' oqsma li jiddefinixxu l-infrastruttura tat-tagħlim tal-magni:

  • ġbir ta' data;
  • taħriġ addizzjonali;
  • skjerament;
  • ittestjar u monitoraġġ.

Jekk l-ambjent huwa instabbli u qed jinbidel kontinwament, allura l-infrastruttura kollha madwar il-mudell tirriżulta li hija ħafna aktar importanti mill-mudell innifsu. Jista 'jkun klassifikatur lineari antik tajjeb, imma jekk titma' l-karatteristiċi t-tajba u tikseb rispons tajjeb mill-utenti, se taħdem ħafna aħjar minn mudelli State-Of-The-Art bil-qniepen u sfafar kollha.

Feedback Loop

Dan iċ-ċiklu jgħaqqad il-ġbir tad-dejta, taħriġ addizzjonali u skjerament - fil-fatt, iċ-ċiklu kollu tal-aġġornament tal-mudell. Għaliex huwa importanti? Ħares lejn l-iskeda tar-reġistrazzjoni fil-posta:

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Żviluppatur tat-tagħlim tal-magni implimenta mudell anti-bot li jipprevjeni lill-bots milli jirreġistraw fl-email. Il-grafika tinżel għal valur fejn jibqgħu biss utenti reali. Kollox huwa kbir! Iżda jgħaddu erba’ sigħat, il-bots ifasslu l-iskripts tagħhom, u kollox jerġa’ lura għan-normal. F'din l-implimentazzjoni, l-iżviluppatur qatta 'xahar iżid karatteristiċi u jħarreġ mill-ġdid il-mudell, iżda l-ispammer seta' jadatta f'erba 'sigħat.

Sabiex ma nkunux daqshekk uġigħ kbir u ma jkollniex għalfejn nerġgħu nagħmlu kollox aktar tard, inizjalment irridu naħsbu dwar kif se tidher il-linja ta 'feedback u x'se nagħmlu jekk l-ambjent jinbidel. Nibdew bil-ġbir tad-dejta - dan huwa l-fjuwil għall-algoritmi tagħna.

Ġbir tad-dejta

Huwa ċar li għan-netwerks newrali moderni, aktar ma jkun hemm dejta, aħjar, u huma, fil-fatt, iġġenerati mill-utenti tal-prodott. L-utenti jistgħu jgħinuna billi jimmarkaw id-dejta, iżda ma nistgħux nabbużaw minn dan, għax f'xi punt l-utenti jiċċekkjaw milli jlestu l-mudelli tiegħek u jaqilbu għal prodott ieħor.

Wieħed mill-iżbalji l-aktar komuni (hawn nagħmel referenza għal Andrew Ng) huwa fokus wisq fuq metriċi fuq is-sett tad-dejta tat-test, u mhux fuq feedback mill-utent, li fil-fatt huwa l-kejl ewlieni tal-kwalità tax-xogħol, peress li noħolqu prodott għall-utent. Jekk l-utent ma jifhimx jew ma jħobbx ix-xogħol tal-mudell, allura kollox huwa ruined.

Għalhekk, l-utent għandu dejjem ikun jista’ jivvota u għandu jingħata għodda għal feedback. Jekk naħsbu li fil-kaxxa tal-posta waslet ittra relatata mal-finanzi, irridu nimmarkawha “finanzi” u niġbdu buttuna li l-utent jista 'jikklikkja u ngħidu li din mhix finanzi.

Kwalità ta 'feedback

Ejja nitkellmu dwar il-kwalità tal-feedback tal-utent. L-ewwelnett, inti u l-utent tista 'tpoġġi tifsiriet differenti f'kunċett wieħed. Pereżempju, int u l-maniġers tal-prodott tiegħek taħseb li "finanzi" tfisser ittri mill-bank, u l-utent jaħseb li ittra min-nanna dwar il-pensjoni tagħha tirreferi wkoll għall-finanzi. It-tieni nett, hemm utenti li bla ħsieb iħobbu jagħfas buttuni mingħajr ebda loġika. It-tielet, l-utent jista 'jkun profondament żbaljat fil-konklużjonijiet tiegħu. Eżempju impressjonanti mill-prattika tagħna huwa l-implimentazzjoni ta 'klassifikatur Spam Niġerjan, tip ta 'spam umoristiku ħafna fejn l-utent huwa mitlub jieħu diversi miljuni ta' dollaru minn qarib imbiegħed misjub f'daqqa fl-Afrika. Wara li implimentajna dan il-klassifikatur, iċċekkajna l-klikks "Mhux Spam" fuq dawn l-emails, u rriżulta li 80% minnhom kienu spam Niġerjan mmerraq, li jissuġġerixxi li l-utenti jistgħu jkunu estremament gullible.

U ma ninsewx li l-buttuni jistgħu jiġu kklikkjati mhux biss minn nies, iżda wkoll minn kull xorta ta 'bot li jippretendu li huma browser. Allura rispons mhux maħdum mhux tajjeb għat-tagħlim. X'tista' tagħmel b'din l-informazzjoni?

Aħna nużaw żewġ approċċi:

  • Feedback minn ML konness. Pereżempju, għandna sistema online anti-bot, li, kif semmejt, tieħu deċiżjoni malajr ibbażata fuq numru limitat ta’ sinjali. U hemm it-tieni sistema bil-mod li taħdem wara l-fatt. Għandu aktar dejta dwar l-utent, l-imġieba tiegħu, eċċ. Bħala riżultat, tittieħed l-aktar deċiżjoni infurmata; għaldaqstant, għandha preċiżjoni u kompletezza ogħla. Tista' tidderieġi d-differenza fit-tħaddim ta' dawn is-sistemi għall-ewwel waħda bħala data tat-taħriġ. Għalhekk, sistema aktar sempliċi dejjem tipprova tersaq lejn il-prestazzjoni ta 'waħda aktar kumplessa.
  • Ikklikkja klassifikazzjoni. Tista 'sempliċement tikklassifika kull klikk tal-utent, tevalwa l-validità u l-użabilità tagħha. Dan nagħmluh fil-posta kontra l-ispam, billi nużaw l-attributi tal-utent, l-istorja tiegħu, l-attributi tal-mittent, it-test innifsu u r-riżultat tal-klassifikaturi. Bħala riżultat, aħna jkollna sistema awtomatika li tivvalida l-feedback tal-utent. U peress li jeħtieġ li jiġi mħarreġ mill-ġdid ħafna inqas spiss, ix-xogħol tiegħu jista 'jsir il-bażi għas-sistemi l-oħra kollha. Il-prijorità ewlenija f'dan il-mudell hija l-preċiżjoni, minħabba li t-taħriġ tal-mudell fuq data mhux preċiża huwa mimli konsegwenzi.

Waqt li qed inaddfu d-dejta u nkomplu nħarrġu s-sistemi ML tagħna, ma rridux ninsew dwar l-utenti, għaliex għalina, eluf, miljuni ta 'żbalji fuq il-graff huma statistika, u għall-utent, kull bug hija traġedja. Minbarra l-fatt li l-utent irid b'xi mod jgħix bl-iżball tiegħek fil-prodott, wara li jirċievi feedback, jistenna li sitwazzjoni simili tiġi eliminata fil-futur. Għalhekk, dejjem ta 'min jagħti lill-utenti mhux biss l-opportunità li jivvutaw, iżda wkoll li jikkoreġu l-imġieba tas-sistemi ML, billi joħolqu, pereżempju, euristiċi personali għal kull klikk ta' feedback; fil-każ tal-posta, din tista 'tkun l-abbiltà li tiffiltra ittri bħal dawn skont il-mittent u t-titlu għal dan l-utent.

Għandek bżonn ukoll tibni mudell ibbażat fuq xi rapporti jew talbiet għall-appoġġ f'mod semi-awtomatiku jew manwali sabiex utenti oħra ma jbatux minn problemi simili.

Euristiċi għat-tagħlim

Hemm żewġ problemi b'dawn l-euristiċi u l-krozzi. L-ewwel hija li n-numru dejjem jiżdied ta 'krozzi huwa diffiċli biex jinżammu, aħseb u ara l-kwalità u l-prestazzjoni tagħhom fit-tul. It-tieni problema hija li l-iżball jista 'ma jkunx frekwenti, u ftit klikks biex ikompli jħarreġ il-mudell mhux se jkun biżżejjed. Jidher li dawn iż-żewġ effetti mhux relatati jistgħu jiġu newtralizzati b'mod sinifikanti jekk jiġi applikat l-approċċ li ġej.

  1. Noħolqu crutch temporanju.
  2. Nibagħtu dejta minnha lill-mudell, taġġorna lilha nnifisha regolarment, inkluż fuq id-dejta riċevuta. Hawnhekk, ovvjament, huwa importanti li l-euristiċi jkollhom preċiżjoni għolja sabiex ma titnaqqasx il-kwalità tad-dejta fis-sett tat-taħriġ.
  3. Imbagħad nissettjaw il-monitoraġġ biex tiskatta l-crutch, u jekk wara xi żmien il-crutch ma tibqax taħdem u tkun kompletament koperta mill-mudell, allura tista 'tneħħiha b'mod sikur. Issa din il-problema x'aktarx ma terġax tiġri.

Allura armata ta 'krozzi hija utli ħafna. Il-ħaġa prinċipali hija li s-servizz tagħhom huwa urġenti u mhux permanenti.

Taħriġ addizzjonali

It-taħriġ mill-ġdid huwa l-proċess li żżid dejta ġdida miksuba bħala riżultat ta 'feedback minn utenti jew sistemi oħra, u t-taħriġ ta' mudell eżistenti fuqha. Jista' jkun hemm diversi problemi b'taħriġ addizzjonali:

  1. Il-mudell jista 'sempliċement ma jappoġġjax taħriġ addizzjonali, iżda jitgħallem biss mill-bidu.
  2. Imkien fil-ktieb tan-natura mhu miktub li taħriġ addizzjonali ċertament se jtejjeb il-kwalità tax-xogħol fil-produzzjoni. Ħafna drabi jiġri l-oppost, jiġifieri, id-deterjorazzjoni biss hija possibbli.
  3. Il-bidliet jistgħu jkunu imprevedibbli. Dan huwa punt pjuttost sottili li identifikajna għalina nfusna. Anke jekk mudell ġdid f'test A/B juri riżultati simili meta mqabbel ma 'dak attwali, dan ma jfissirx li se jaħdem b'mod identiku. Ix-xogħol tagħhom jista 'jkun differenti f'wieħed fil-mija biss, li jista' jġib żbalji ġodda jew jirritorna dawk qodma li diġà ġew ikkoreġuti. Kemm aħna kif ukoll l-utenti diġà nafu kif ngħixu bi żbalji attwali, u meta jinqalgħu numru kbir ta 'żbalji ġodda, l-utent jista' wkoll ma jifhimx x'qed jiġri, minħabba li jistenna mġiba prevedibbli.

Għalhekk, l-iktar ħaġa importanti fit-taħriġ addizzjonali hija li jiġi żgurat li l-mudell jittejjeb, jew għall-inqas ma jiħrax.

L-ewwel ħaġa li tiġi f’moħħna meta nitkellmu dwar taħriġ addizzjonali huwa l-approċċ ta’ Tagħlim Attiv. Xi jfisser dan? Pereżempju, il-klassifikatur jiddetermina jekk email hijiex relatata mal-finanzi, u madwar il-konfini tad-deċiżjoni tagħha aħna nżidu kampjun ta 'eżempji ttikkettjati. Dan jaħdem tajjeb, pereżempju, fir-reklamar, fejn hemm ħafna feedback u tista 'tħarreġ il-mudell onlajn. U jekk ikun hemm ftit feedback, allura nġibu kampjun preġudikat ħafna relattiv għad-distribuzzjoni tad-dejta tal-produzzjoni, li fuq il-bażi tiegħu huwa impossibbli li tiġi evalwata l-imġieba tal-mudell waqt it-tħaddim.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Fil-fatt, l-għan tagħna huwa li nippreservaw mudelli qodma, mudelli diġà magħrufa, u nakkwistaw oħrajn ġodda. Il-kontinwità hija importanti hawnhekk. Il-mudell, li ħafna drabi ħadna uġigħ kbir biex niftakru, diġà qed jaħdem, sabiex inkunu nistgħu niffukaw fuq il-prestazzjoni tiegħu.

Mudelli differenti huma użati fil-posta: siġar, lineari, netwerks newrali. Għal kull wieħed nagħmlu l-algoritmu ta 'taħriġ addizzjonali tagħna stess. Fil-proċess ta 'taħriġ addizzjonali, aħna nirċievu mhux biss dejta ġdida, iżda wkoll ħafna drabi karatteristiċi ġodda, li se nqisu fl-algoritmi kollha hawn taħt.

Mudelli lineari

Ejja ngħidu li għandna rigressjoni loġistika. Aħna noħolqu mudell ta 'telf mill-komponenti li ġejjin:

  • LogLoss fuq data ġdida;
  • aħna nirregolarizzaw il-piżijiet ta 'karatteristiċi ġodda (ma nmissux dawk qodma);
  • nitgħallmu wkoll minn data antika sabiex nippreservaw mudelli qodma;
  • u, forsi, l-iktar ħaġa importanti: inżidu Regolarizzazzjoni Harmonika, li tiggarantixxi li l-piżijiet ma jinbidlux ħafna meta mqabbla mal-mudell l-antik skond in-norma.

Peress li kull komponent Telf għandu koeffiċjenti, nistgħu nagħżlu l-aħjar valuri għall-kompitu tagħna permezz ta 'validazzjoni inkroċjata jew ibbażati fuq ir-rekwiżiti tal-prodott.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Siġar

Ejja ngħaddu għas-siġar tad-deċiżjonijiet. Aħna kkumpilajna l-algoritmu li ġej għal taħriġ addizzjonali tas-siġar:

  1. Il-produzzjoni tmexxi foresta ta '100-300 siġra, li hija mħarrġa fuq sett ta' data antik.
  2. Fl-aħħar inneħħu M = 5 biċċiet u nżidu 2M = 10 ġodda, imħarrġa fuq is-sett tad-dejta kollu, iżda b'piż għoli għad-dejta l-ġdida, li naturalment tiggarantixxi bidla inkrementali fil-mudell.

Ovvjament, maż-żmien, in-numru ta 'siġar jiżdied ħafna, u għandhom jitnaqqsu perjodikament sabiex jilħqu l-ħinijiet. Biex nagħmlu dan, nużaw id-Distillazzjoni tal-Għarfien (KD) li issa tinsab kullimkien. Fil-qosor dwar il-prinċipju tat-tħaddim tiegħu.

  1. Għandna l-mudell "kumpless" attwali. Aħna nħaddmuha fuq is-sett tad-dejta tat-taħriġ u nġibu d-distribuzzjoni tal-probabbiltà tal-klassi fl-output.
  2. Sussegwentement, inħarrġu l-mudell tal-istudent (il-mudell b'inqas siġar f'dan il-każ) biex jirrepeti r-riżultati tal-mudell billi juża d-distribuzzjoni tal-klassi bħala l-varjabbli fil-mira.
  3. Huwa importanti li wieħed jinnota hawnhekk li aħna ma nużaw l-markup tas-sett tad-dejta bl-ebda mod, u għalhekk nistgħu nużaw dejta arbitrarja. Naturalment, nużaw kampjun tad-dejta mill-fluss tal-ġlied bħala kampjun ta 'taħriġ għall-mudell tal-istudent. Għalhekk, is-sett tat-taħriġ jippermettilna niżguraw l-eżattezza tal-mudell, u l-kampjun tan-nixxiegħa jiggarantixxi prestazzjoni simili fuq id-distribuzzjoni tal-produzzjoni, li jikkumpensa għall-preġudizzju tas-sett tat-taħriġ.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Il-kombinazzjoni ta 'dawn iż-żewġ tekniki (żieda ta' siġar u perjodikament tnaqqas in-numru tagħhom bl-użu tad-Distillazzjoni tal-Għarfien) tiżgura l-introduzzjoni ta 'mudelli ġodda u kontinwità sħiħa.

Bl-għajnuna ta 'KD, aħna nwettqu wkoll operazzjonijiet differenti fuq il-karatteristiċi tal-mudell, bħat-tneħħija tal-karatteristiċi u l-ħidma fuq il-lakuni. Fil-każ tagħna, għandna numru ta 'karatteristiċi statistiċi importanti (minn min jibgħat, test hashes, URLs, eċċ.) Li huma maħżuna fid-database, li għandhom tendenza li jfallu. Il-mudell, ovvjament, mhuwiex lest għal tali żvilupp ta 'avvenimenti, peress li sitwazzjonijiet ta' falliment ma jseħħux fis-sett ta 'taħriġ. F'każijiet bħal dawn, aħna ngħaqqdu tekniki KD u awmentazzjoni: meta nitħarrġu għal parti mid-dejta, inneħħu jew reset il-karatteristiċi meħtieġa, u nieħdu t-tikketti oriġinali (outputs tal-mudell attwali), u l-mudell tal-istudent jitgħallem jirrepeti din id-distribuzzjoni .

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Aħna ndunat li aktar ma sseħħ manipulazzjoni serja tal-mudell, iktar ikun kbir il-perċentwal tal-kampjun tal-ħajt meħtieġ.

It-tneħħija tal-karatteristiċi, l-aktar operazzjoni sempliċi, teħtieġ biss parti żgħira mill-fluss, peress li biss ftit karatteristiċi jinbidlu, u l-mudell attwali kien imħarreġ fuq l-istess sett - id-differenza hija minima. Biex tissimplifika l-mudell (li tnaqqas in-numru ta 'siġar diversi drabi), diġà hija meħtieġa 50 sa 50. U għal ommissjonijiet ta' karatteristiċi statistiċi importanti li se jaffettwaw serjament il-prestazzjoni tal-mudell, saħansitra aktar fluss huwa meħtieġ biex jiġi livellat ix-xogħol tal- mudell ġdid reżistenti għall-ommissjoni fuq kull tip ta 'ittri.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

FastText

Ejja ngħaddu għal FastText. Ħa nfakkarkom li r-rappreżentazzjoni (Inkorporazzjoni) ta' kelma tikkonsisti mis-somma ta' l-inkorporazzjoni tal-kelma nnifisha u l-ittra N-grammi kollha tagħha, normalment trigrammi. Peress li jista 'jkun hemm ħafna trigrammi, jintuża Bucket Hashing, jiġifieri, jikkonverti l-ispazju kollu f'ċertu hashmap fiss. Bħala riżultat, il-matriċi tal-piż tinkiseb bid-dimensjoni tas-saff ta 'ġewwa għal kull numru ta' kliem + bramel.

B'taħriġ addizzjonali, jidhru sinjali ġodda: kliem u trigrammi. Ma jiġri xejn sinifikanti fit-taħriġ ta 'segwitu standard minn Facebook. Piżijiet qodma biss b'entropija inkroċjata huma mħarrġa mill-ġdid fuq data ġdida. Għalhekk, ma jintużawx karatteristiċi ġodda; ovvjament, dan l-approċċ għandu l-iżvantaġġi kollha deskritti hawn fuq assoċjati mal-imprevedibbiltà tal-mudell fil-produzzjoni. Huwa għalhekk li mmodifikajna ftit FastText. Aħna nżidu l-piżijiet ġodda kollha (kliem u trigrammi), nespandu l-matriċi kollha b'entropija inkroċjata u nżidu regolarizzazzjoni armonika b'analoġija mal-mudell lineari, li jiggarantixxi bidla insinifikanti fil-piżijiet qodma.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

CNN

In-netwerks konvoluzzjonali huma daqsxejn aktar ikkumplikati. Jekk l-aħħar saffi jitlestew fis-CNN, allura, ovvjament, tista 'tapplika regolarizzazzjoni armonika u tiggarantixxi l-kontinwità. Imma jekk ikun meħtieġ taħriġ addizzjonali tan-netwerk kollu, allura tali regolarizzazzjoni ma tistax tiġi applikata aktar għas-saffi kollha. Madankollu, hemm għażla li tħarreġ inkorporazzjonijiet komplementari permezz ta' Triplet Loss (artikolu oriġinali).

Telf Triplu

Billi tuża kompitu kontra l-phishing bħala eżempju, ejja nħarsu lejn Triplet Loss f'termini ġenerali. Nieħdu l-logo tagħna, kif ukoll eżempji pożittivi u negattivi ta 'logos ta' kumpaniji oħra. Aħna nimminimizzaw id-distanza bejn l-ewwel u timmassimizzaw id-distanza bejn it-tieni, nagħmlu dan b'vojt żgħir biex niżguraw kompattezza akbar tal-klassijiet.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Jekk inħarrġu aktar in-netwerk, allura l-ispazju metriku tagħna jinbidel kompletament, u jsir kompletament inkompatibbli ma 'dak ta' qabel. Din hija problema serja fi problemi li jużaw vectors. Biex nersqu din il-problema, aħna se nħalltu inkorporazzjonijiet qodma waqt it-taħriġ.

Żidna dejta ġdida mas-sett tat-taħriġ u qed nitħarrġu t-tieni verżjoni tal-mudell mill-bidu. Fit-tieni stadju, inkomplu nħarrġu n-netwerk tagħna (Finetuning): l-ewwel jitlesta l-aħħar saff, u mbagħad in-netwerk kollu ma jiġix iffriżat. Fil-proċess ta 'kompożizzjoni ta' triplets, aħna nikkalkulaw parti biss mill-inkorporazzjonijiet bl-użu tal-mudell imħarreġ, il-bqija - bl-użu ta 'l-antik. Għalhekk, fil-proċess ta 'taħriġ addizzjonali, aħna niżguraw il-kompatibilità ta' spazji metriċi v1 u v2. Verżjoni unika tar-regolarizzazzjoni armonika.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Arkitettura kollha

Jekk inqisu s-sistema kollha li tuża l-antispam bħala eżempju, allura l-mudelli mhumiex iżolati, iżda mnaqqsa fi ħdan xulxin. Nieħdu stampi, test u karatteristiċi oħra, bl-użu tas-CNN u Fast Test niksbu inkorporazzjonijiet. Sussegwentement, il-klassifikaturi huma applikati fuq l-inkorporazzjonijiet, li jipprovdu punteġġi għal diversi klassijiet (tipi ta 'ittri, spam, preżenza ta' logo). Is-sinjali u s-sinjali diġà qed jidħlu fil-foresta tas-siġar biex tittieħed id-deċiżjoni finali. Klassifikaturi individwali f'din l-iskema jagħmluha possibbli li jiġu interpretati aħjar ir-riżultati tas-sistema u b'mod aktar speċifiku l-komponenti jerġgħu jitħarrġu f'każ ta 'problemi, aktar milli tgħaddi d-dejta kollha fis-siġar tad-deċiżjonijiet f'forma mhux maħduma.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Bħala riżultat, niggarantixxu kontinwità f'kull livell. Fil-livell t'isfel fis-CNN u Fast Test nużaw ir-regolarizzazzjoni armonika, għall-klassifikaturi fin-nofs nużaw ukoll ir-regolarizzazzjoni armonika u l-kalibrazzjoni tar-rata għall-konsistenza tad-distribuzzjoni tal-probabbiltà. Ukoll, it-tisħiħ tas-siġar huwa mħarreġ b'mod inkrementali jew bl-użu tad-Distillazzjoni tal-Għarfien.

B'mod ġenerali, iż-żamma ta 'tali sistema ta' tagħlim tal-magni nested hija ġeneralment uġigħ, peress li kwalunkwe komponent fil-livell aktar baxx iwassal għal aġġornament għas-sistema kollha ta 'hawn fuq. Iżda peress li fis-setup tagħna kull komponent jinbidel ftit u huwa kompatibbli ma 'dak ta' qabel, is-sistema kollha tista 'tiġi aġġornata biċċa biċċa mingħajr il-ħtieġa li terġa' titħarreġ l-istruttura kollha, li tippermetti li tkun appoġġjata mingħajr overhead serju.

Skjerament

Iddiskutejna l-ġbir tad-dejta u t-taħriġ addizzjonali ta 'tipi differenti ta' mudelli, għalhekk qed nimxu fuq l-iskjerament tagħhom fl-ambjent tal-produzzjoni.

Ittestjar A/B

Kif għidt qabel, fil-proċess tal-ġbir tad-dejta, ġeneralment niksbu kampjun preġudikat, li minnu huwa impossibbli li tiġi evalwata l-prestazzjoni tal-produzzjoni tal-mudell. Għalhekk, meta jiġi skjerat, il-mudell għandu jitqabbel mal-verżjoni preċedenti sabiex jifhem kif l-affarijiet fil-fatt sejrin, jiġifieri, twettaq testijiet A/B. Fil-fatt, il-proċess ta 'rolling out u analiżi ta' charts huwa pjuttost ta 'rutina u jista' jiġi awtomatizzat faċilment. Aħna niftakru l-mudelli tagħna gradwalment għal 5%, 30%, 50% u 100% tal-utenti, filwaqt li niġbru l-metriċi kollha disponibbli dwar it-tweġibiet tal-mudelli u l-feedback tal-utenti. Fil-każ ta 'xi outliers serji, aħna awtomatikament nerġgħu lura l-mudell, u għal każijiet oħra, wara li ġabar numru suffiċjenti ta' klikks tal-utent, aħna niddeċiedu li nżidu l-perċentwal. Bħala riżultat, aħna nġibu l-mudell il-ġdid għal 50% tal-utenti kompletament awtomatikament, u t-tnedija lill-udjenza kollha se tkun approvata minn persuna, għalkemm dan il-pass jista 'jiġi awtomatizzat.

Madankollu, il-proċess tal-ittestjar A/B joffri spazju għall-ottimizzazzjoni. Il-fatt hu li kwalunkwe test A/B huwa pjuttost twil (fil-każ tagħna jieħu minn 6 sa 24 siegħa skont l-ammont ta 'feedback), li jagħmilha pjuttost għalja u b'riżorsi limitati. Barra minn hekk, huwa meħtieġ perċentwal għoli biżżejjed ta’ fluss għat-test biex essenzjalment jitħaffef il-ħin ġenerali tat-test A/B (ir-reklutaġġ ta’ kampjun statistikament sinifikanti biex jevalwa l-metriċi f’persentaġġ żgħir jista’ jieħu żmien twil ħafna), li jagħmel in-numru ta 'slots A/B estremament limitat. Ovvjament, irridu nittestjaw biss il-mudelli l-aktar promettenti, li minnhom nirċievu ħafna matul il-proċess ta 'taħriġ addizzjonali.

Biex issolvi din il-problema, tħarreġna klassifikatur separat li jbassar is-suċċess ta 'test A/B. Biex nagħmlu dan, nieħdu statistika tat-teħid tad-deċiżjonijiet, Preċiżjoni, Recall u metriċi oħra fuq is-sett ta 'taħriġ, fuq dak differit, u fuq il-kampjun mill-fluss bħala karatteristiċi. Aħna nqabblu wkoll il-mudell ma 'dak attwali fil-produzzjoni, bl-euristika, u nqisu l-Kumplessità tal-mudell. Billi juża dawn il-karatteristiċi kollha, klassifikatur imħarreġ fuq l-istorja tat-test jevalwa mudelli kandidati, fil-każ tagħna dawn huma foresti ta 'siġar, u jiddeċiedi liema waħda tuża fit-test A/B.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Fiż-żmien tal-implimentazzjoni, dan l-approċċ ippermettilna nżidu n-numru ta 'testijiet A/B b'suċċess diversi drabi.

Ittestjar u Monitoraġġ

L-ittestjar u l-monitoraġġ, strambament, ma jagħmlux ħsara lil saħħitna, anzi, għall-kuntrarju, itejbuha u jeħlisuna minn stress bla bżonn. L-ittestjar jippermettilek tipprevjeni falliment, u l-monitoraġġ jippermettilek tiskoprih fil-ħin biex tnaqqas l-impatt fuq l-utenti.

Huwa importanti li tifhem hawn li llum jew għada s-sistema tiegħek dejjem se tagħmel żbalji - dan huwa dovut għaċ-ċiklu ta 'żvilupp ta' kwalunkwe softwer. Fil-bidu tal-iżvilupp tas-sistema dejjem ikun hemm ħafna bugs sakemm kollox jissetilja u jitlesta l-istadju ewlieni tal-innovazzjoni. Iżda maż-żmien, l-entropija tieħu effett, u l-iżbalji jerġgħu jidhru - minħabba d-degradazzjoni tal-komponenti madwar u l-bidliet fid-dejta, li tkellimt dwarhom fil-bidu.

Hawnhekk nixtieq ninnota li kull sistema ta 'tagħlim tal-magni għandha titqies mil-lat tal-profitt tagħha matul iċ-ċiklu tal-ħajja kollu tagħha. Il-graff ta' hawn taħt turi eżempju ta' kif taħdem is-sistema biex taqbad tip rari ta' spam (il-linja fil-graff hija qrib iż-żero). Ġurnata waħda, minħabba attribut cached ħażin, marret miġnun. Xorti kienet, ma kien hemm l-ebda monitoraġġ għal triggering anormali; bħala riżultat, is-sistema bdiet issalva ittri fi kwantitajiet kbar fil-folder "spam" fil-konfini tat-teħid tad-deċiżjonijiet. Minkejja li kkoreġiet il-konsegwenzi, is-sistema diġà għamlet żbalji tant li mhux se tħallas għaliha nnifisha lanqas f’ħames snin. U dan huwa falliment sħiħ mil-lat taċ-ċiklu tal-ħajja tal-mudell.

It-tħaddim tat-tagħlim tal-magni fil-Mail.ru Mail

Għalhekk, ħaġa sempliċi bħal monitoraġġ tista 'ssir essenzjali fil-ħajja ta' mudell. Minbarra l-metriċi standard u ovvji, aħna nikkunsidraw id-distribuzzjoni ta 'tweġibiet tal-mudell u punteġġi, kif ukoll id-distribuzzjoni tal-valuri tal-karatteristiċi ewlenin. Bl-użu tad-diverġenza KL, nistgħu nqabblu d-distribuzzjoni attwali ma 'dik storika jew il-valuri fit-test A/B mal-bqija tan-nixxiegħa, li jippermettilna ninnutaw anomaliji fil-mudell u nġibu lura l-bidliet fil-ħin.

Fil-biċċa l-kbira tal-każijiet, inniedu l-ewwel verżjonijiet tagħna tas-sistemi bl-użu ta’ euristiċi sempliċi jew mudelli li nużaw bħala monitoraġġ fil-futur. Pereżempju, aħna nissorveljaw il-mudell NER meta mqabbel ma 'dawk regolari għal ħwienet onlajn speċifiċi, u jekk il-kopertura tal-klassifikatur tonqos meta mqabbla magħhom, allura nifhmu r-raġunijiet. Użu utli ieħor tal-euristika!

Riżultati ta '

Ejja ngħaddu mill-ġdid fuq l-ideat ewlenin tal-artiklu.

  • Fibdeck. Aħna dejjem naħsbu dwar l-utent: kif se jgħix bl-iżbalji tagħna, kif se jkun kapaċi jirrapportahom. Tinsiex li l-utenti mhumiex sors ta 'feedback pur għal mudelli ta' taħriġ, u jeħtieġ li jiġi kklerjat bl-għajnuna ta 'sistemi ML awżiljarji. Jekk ma jkunx possibbli li jinġabar sinjal mill-utent, allura nfittxu sorsi alternattivi ta 'feedback, pereżempju, sistemi konnessi.
  • Taħriġ addizzjonali. Il-ħaġa prinċipali hawnhekk hija l-kontinwità, għalhekk aħna niddependu fuq il-mudell tal-produzzjoni attwali. Aħna nħarrġu mudelli ġodda sabiex ma jvarjawx ħafna minn dak preċedenti minħabba regolarizzazzjoni armonika u tricks simili.
  • Skjerament. L-iskjerament awtomatiku bbażat fuq metriċi jnaqqas ħafna l-ħin għall-implimentazzjoni tal-mudelli. L-istatistika tal-monitoraġġ u d-distribuzzjoni tat-teħid tad-deċiżjonijiet, in-numru ta 'waqgħat mill-utenti huwa obbligatorju għall-irqad serħan u tmiem il-ġimgħa produttiv tiegħek.

Ukoll, nittama li dan jgħinek ittejjeb is-sistemi ML tiegħek aktar malajr, twassalhom fis-suq aktar malajr, u tagħmilhom aktar affidabbli u inqas stressanti.

Sors: www.habr.com

Żid kumment