В
Umsókn
Fráviksgreining er notuð á svæðum eins og:
1) Spá um bilanir í búnaði
Þannig var árið 2010 ráðist á íranskar skilvindur af Stuxnet-vírusnum, sem setti búnaðinn í óhagkvæman rekstur og gerði hluta búnaðarins óvirkan vegna hraðari slits.
Ef fráviksgreiningaralgrím hefðu verið notuð á búnaðinum hefði verið hægt að forðast bilunarástandið.
Leitin að frávikum í rekstri búnaðar er ekki aðeins notuð í kjarnorkuiðnaði, heldur einnig í málmvinnslu og rekstri flugvélahverfla. Og á öðrum sviðum þar sem notkun forspárgreiningar er ódýrari en hugsanlegt tap vegna ófyrirsjáanlegs bilunar.
2) Svikspá
Ef peningar eru teknir af kortinu sem þú notar í Podolsk í Albaníu gæti þurft að athuga færslurnar frekar.
3) Greining á óeðlilegum neytendamynstri
Ef sumir viðskiptavinir sýna óeðlilega hegðun getur verið vandamál sem þú ert ekki meðvitaður um.
4) Greining á óeðlilegri eftirspurn og álagi
Ef sala í FMCG-verslun hefur farið niður fyrir öryggisbil spár er rétt að finna ástæðu þess sem er að gerast.
Aðferðir til að greina frávik
1) Styðjið vektorvél með einum flokki eins flokks SVM
Hentar vel þegar gögnin í þjálfunarsettinu fylgja eðlilegri dreifingu en prófunarsettið inniheldur frávik.
Eins flokks stuðningsvektorvél smíðar ólínulegt yfirborð í kringum upprunann. Það er hægt að setja niðurskurðarmörk fyrir hvaða gögn eru talin afbrigðileg.
Byggt á reynslu DATA4 teymisins okkar er One-Class SVM algengasta reikniritið til að leysa vandamálið við að finna frávik.
2) Einangrað skógaraðferð
Með „handahófskenndu“ aðferðinni við að smíða tré mun útblástur fara í laufblöðin á fyrstu stigum (á grunnu dýpi trésins), þ.e. auðveldara er að „einangra“ losun. Einangrun afbrigðilegra gilda á sér stað í fyrstu endurtekningum reikniritsins.
3) sporöskjulaga umslag og tölfræðilegar aðferðir
Notað þegar gögnin eru venjulega dreifð. Því nær sem mælingin er hala dreifingarblöndunnar, því afbrigðilegra er gildið.
Aðrar tölfræðilegar aðferðir geta einnig verið með í þessum flokki.
Mynd frá dyakonov.org
4) Metraaðferðir
Aðferðir fela í sér reiknirit eins og k-nearest neighbors, k-nearest neighbor, ABOD (horn-based outlier detection) eða LOF (local outlier factor).
Hentar ef fjarlægðin milli gildanna í eiginleikum er jafngild eða staðlað (til að mæla ekki bóaþrengsli í páfagaukum).
Reikniritið k-næstu nágranna gerir ráð fyrir að eðlileg gildi séu staðsett á ákveðnu svæði fjölvíddar rýmis og fjarlægðin til frávika verður meiri en til aðskilnaðar hyperplane.
5) Klasaaðferðir
Kjarni klasaaðferða er sá að ef gildi er meira en ákveðið magn í burtu frá klasamiðstöðvum getur gildið talist frávik.
Aðalatriðið er að nota reiknirit sem flokkar gögnin rétt, sem fer eftir tilteknu verkefni.
6) Aðalþáttaaðferð
Hentar þar sem leiðbeiningar mestu dreifingarinnar eru dregnar fram.
7) Reiknirit byggð á tímaraðarspám
Hugmyndin er sú að ef gildi fellur utan spáöryggisbils teljist gildið afbrigðilegt. Til að spá fyrir um tímaröð er notast við reiknirit eins og þrefalda sléttun, S(ARIMA), örvun o.s.frv.
Fjallað var um reiknirit fyrir tímaraðarspá í fyrri greininni.
8) Nám undir eftirliti (aðhvarf, flokkun)
Ef gögnin leyfa, notum við reiknirit allt frá línulegri aðhvarf til endurtekinna neta. Mælum muninn á spánni og raungildinu og drögum ályktun að hve miklu leyti gögnin víkja frá norminu. Mikilvægt er að reikniritið hafi nægilega alhæfingargetu og að þjálfunarsettið innihaldi ekki afbrigðileg gildi.
9) Líkanprófanir
Við skulum nálgast vandamálið við að leita að frávikum sem vandamál við að leita að meðmælum. Við skulum sundurliða eiginleika fylkið okkar með því að nota SVD eða þáttunarvélar og taka gildin í nýja fylkinu sem eru verulega frábrugðin þeim upprunalegu sem afbrigðileg.
Mynd frá dyakonov.org
Ályktun
Í þessari grein fórum við yfir helstu aðferðir til að greina frávik.
Að finna frávik má á margan hátt kalla list. Það er ekkert tilvalið reiknirit eða nálgun, notkun þeirra leysir öll vandamál. Oftar er sett af aðferðum notað til að leysa tiltekið mál. Fráviksuppgötvun er framkvæmd með því að nota eins flokks stuðningsvektorvélar, einangrunarskóga, mæligildi og klasaaðferðir, auk þess að nota aðalhluta og tímaraðarspá.
Ef þú þekkir aðrar aðferðir skaltu skrifa um þær í athugasemdum við greinina.
Heimild: www.habr.com