9 aðferðir til að greina frávik

В Fyrri grein við ræddum tímaraðarspá. Rökrétt framhald væri grein um að greina frávik.

Umsókn

Fráviksgreining er notuð á svæðum eins og:

1) Spá um bilanir í búnaði

Þannig var árið 2010 ráðist á íranskar skilvindur af Stuxnet-vírusnum, sem setti búnaðinn í óhagkvæman rekstur og gerði hluta búnaðarins óvirkan vegna hraðari slits.

Ef fráviksgreiningaralgrím hefðu verið notuð á búnaðinum hefði verið hægt að forðast bilunarástandið.

9 aðferðir til að greina frávik

Leitin að frávikum í rekstri búnaðar er ekki aðeins notuð í kjarnorkuiðnaði, heldur einnig í málmvinnslu og rekstri flugvélahverfla. Og á öðrum sviðum þar sem notkun forspárgreiningar er ódýrari en hugsanlegt tap vegna ófyrirsjáanlegs bilunar.

2) Svikspá

Ef peningar eru teknir af kortinu sem þú notar í Podolsk í Albaníu gæti þurft að athuga færslurnar frekar.

3) Greining á óeðlilegum neytendamynstri

Ef sumir viðskiptavinir sýna óeðlilega hegðun getur verið vandamál sem þú ert ekki meðvitaður um.

4) Greining á óeðlilegri eftirspurn og álagi

Ef sala í FMCG-verslun hefur farið niður fyrir öryggisbil spár er rétt að finna ástæðu þess sem er að gerast.

Aðferðir til að greina frávik

1) Styðjið vektorvél með einum flokki eins flokks SVM

Hentar vel þegar gögnin í þjálfunarsettinu fylgja eðlilegri dreifingu en prófunarsettið inniheldur frávik.

Eins flokks stuðningsvektorvél smíðar ólínulegt yfirborð í kringum upprunann. Það er hægt að setja niðurskurðarmörk fyrir hvaða gögn eru talin afbrigðileg.

Byggt á reynslu DATA4 teymisins okkar er One-Class SVM algengasta reikniritið til að leysa vandamálið við að finna frávik.

9 aðferðir til að greina frávik

2) Einangrað skógaraðferð

Með „handahófskenndu“ aðferðinni við að smíða tré mun útblástur fara í laufblöðin á fyrstu stigum (á grunnu dýpi trésins), þ.e. auðveldara er að „einangra“ losun. Einangrun afbrigðilegra gilda á sér stað í fyrstu endurtekningum reikniritsins.

9 aðferðir til að greina frávik

3) sporöskjulaga umslag og tölfræðilegar aðferðir

Notað þegar gögnin eru venjulega dreifð. Því nær sem mælingin er hala dreifingarblöndunnar, því afbrigðilegra er gildið.

Aðrar tölfræðilegar aðferðir geta einnig verið með í þessum flokki.

9 aðferðir til að greina frávik

9 aðferðir til að greina frávik
Mynd frá dyakonov.org

4) Metraaðferðir

Aðferðir fela í sér reiknirit eins og k-nearest neighbors, k-nearest neighbor, ABOD (horn-based outlier detection) eða LOF (local outlier factor).

Hentar ef fjarlægðin milli gildanna í eiginleikum er jafngild eða staðlað (til að mæla ekki bóaþrengsli í páfagaukum).

Reikniritið k-næstu nágranna gerir ráð fyrir að eðlileg gildi séu staðsett á ákveðnu svæði fjölvíddar rýmis og fjarlægðin til frávika verður meiri en til aðskilnaðar hyperplane.

9 aðferðir til að greina frávik

5) Klasaaðferðir

Kjarni klasaaðferða er sá að ef gildi er meira en ákveðið magn í burtu frá klasamiðstöðvum getur gildið talist frávik.

Aðalatriðið er að nota reiknirit sem flokkar gögnin rétt, sem fer eftir tilteknu verkefni.

9 aðferðir til að greina frávik

6) Aðalþáttaaðferð

Hentar þar sem leiðbeiningar mestu dreifingarinnar eru dregnar fram.

7) Reiknirit byggð á tímaraðarspám

Hugmyndin er sú að ef gildi fellur utan spáöryggisbils teljist gildið afbrigðilegt. Til að spá fyrir um tímaröð er notast við reiknirit eins og þrefalda sléttun, S(ARIMA), örvun o.s.frv.

Fjallað var um reiknirit fyrir tímaraðarspá í fyrri greininni.

9 aðferðir til að greina frávik

8) Nám undir eftirliti (aðhvarf, flokkun)

Ef gögnin leyfa, notum við reiknirit allt frá línulegri aðhvarf til endurtekinna neta. Mælum muninn á spánni og raungildinu og drögum ályktun að hve miklu leyti gögnin víkja frá norminu. Mikilvægt er að reikniritið hafi nægilega alhæfingargetu og að þjálfunarsettið innihaldi ekki afbrigðileg gildi.

9) Líkanprófanir

Við skulum nálgast vandamálið við að leita að frávikum sem vandamál við að leita að meðmælum. Við skulum sundurliða eiginleika fylkið okkar með því að nota SVD eða þáttunarvélar og taka gildin í nýja fylkinu sem eru verulega frábrugðin þeim upprunalegu sem afbrigðileg.

9 aðferðir til að greina frávik

Mynd frá dyakonov.org

Ályktun

Í þessari grein fórum við yfir helstu aðferðir til að greina frávik.

Að finna frávik má á margan hátt kalla list. Það er ekkert tilvalið reiknirit eða nálgun, notkun þeirra leysir öll vandamál. Oftar er sett af aðferðum notað til að leysa tiltekið mál. Fráviksuppgötvun er framkvæmd með því að nota eins flokks stuðningsvektorvélar, einangrunarskóga, mæligildi og klasaaðferðir, auk þess að nota aðalhluta og tímaraðarspá.

Ef þú þekkir aðrar aðferðir skaltu skrifa um þær í athugasemdum við greinina.

Heimild: www.habr.com

Bæta við athugasemd