9 pieejas anomāliju noteikŔanai

Š’ iepriekŔējais raksts mēs runājām par laika rindu prognozÄ“Å”anu. LoÄ£isks turpinājums bÅ«tu raksts par anomāliju noteikÅ”anu.

iesniegums

Anomāliju noteikŔana tiek izmantota tādās jomās kā:

1) Iekārtu bojājumu prognozÄ“Å”ana

Tādējādi 2010. gadā Irānas centrifūgām uzbruka Stuxnet vīruss, kas iestatīja iekārtas neoptimālā režīmā un atspējoja dažas iekārtas paātrināta nolietojuma dēļ.

Ja iekārtā bÅ«tu izmantoti anomāliju noteikÅ”anas algoritmi, atteices situāciju varētu izvairÄ«ties.

9 pieejas anomāliju noteikŔanai

Iekārtu darbÄ«bas anomāliju meklÄ“Å”ana tiek izmantota ne tikai kodolrÅ«pniecÄ«bā, bet arÄ« metalurÄ£ijā un lidmaŔīnu turbÄ«nu darbÄ«bā. Un citās jomās, kur paredzamās diagnostikas izmantoÅ”ana ir lētāka nekā iespējamie zaudējumi neparedzama bojājuma dēļ.

2) KrāpÅ”anas prognozÄ“Å”ana

Ja nauda tiek izņemta no kartes, kuru izmantojat Podoļskā Albānijā, iespējams, būs jāveic papildu pārbaude.

3) Nenormālu patērētāju modeļu identificÄ“Å”ana

Ja daži klienti uzvedas neparasti, iespējams, ir radusies problēma, par kuru jūs nezināt.

4) Nenormāla pieprasÄ«juma un slodzes identificÄ“Å”ana

Ja FMCG veikalā pārdoÅ”anas apjomi ir noslÄ«dējuÅ”i zem prognozes ticamÄ«bas intervāla, ir vērts atrast notikuŔā iemeslu.

Pieejas anomāliju noteikŔanai

1) Atbalstiet vektora maŔīnu ar vienas klases vienas klases SVM

Piemērots, ja dati treniņu komplektā atbilst normālam sadalījumam, bet testa komplektā ir anomālijas.

Vienas klases atbalsta vektora maŔīna konstruē nelineāru virsmu ap sākumu. Ir iespējams iestatÄ«t robežvērtÄ«bu, par kuru dati tiek uzskatÄ«ti par anomāliem.

Balstoties uz mÅ«su DATA4 komandas pieredzi, One-Class SVM ir visbiežāk izmantotais algoritms anomāliju atraÅ”anas problēmas risināŔanai.

9 pieejas anomāliju noteikŔanai

2) Izolācijas meža metode

Izmantojot koku konstruÄ“Å”anas ā€œizlasesā€ metodi, emisijas iekļūs lapās agrÄ«nā stadijā (nelielā koka dziļumā), t.i. emisijas ir vieglāk "izolēt". Anomālo vērtÄ«bu izolācija notiek pirmajās algoritma iterācijās.

9 pieejas anomāliju noteikŔanai

3) Eliptiskā apvalka un statistikas metodes

Izmanto, ja dati ir normāli izplatīti. Jo tuvāk mērījums ir sadalījumu maisījuma astei, jo anomālāka ir vērtība.

Šajā klasē var iekļaut arī citas statistikas metodes.

9 pieejas anomāliju noteikŔanai

9 pieejas anomāliju noteikŔanai
Attēls no dyakonov.org

4) Metriskās metodes

Metodes ietver tādus algoritmus kā k-tuvākie kaimiņi, k-tuvākais kaimiņŔ, ABOD (uz leņķi balstÄ«ta izņēmuma noteikÅ”ana) vai LOF (vietējais izņēmuma faktors).

Piemērots, ja attālums starp raksturlielumu vērtībām ir līdzvērtīgs vai normalizēts (lai papagaiļos netiktu izmērīts boa konstriktors).

K-tuvāko kaimiņu algoritms pieņem, ka normālās vērtÄ«bas atrodas noteiktā daudzdimensiju telpas reÄ£ionā un attālums lÄ«dz anomālijām bÅ«s lielāks nekā lÄ«dz atdaloÅ”ajai hiperplaknei.

9 pieejas anomāliju noteikŔanai

5) Klasteru metodes

Klasteru metožu būtība ir tāda, ka, ja vērtība atrodas vairāk nekā noteiktu summu attālumā no klasteru centriem, vērtību var uzskatīt par anomālu.

Galvenais ir izmantot algoritmu, kas pareizi sagrupē datus, kas ir atkarīgs no konkrētā uzdevuma.

9 pieejas anomāliju noteikŔanai

6) Galvenās sastāvdaļas metode

Piemērots tur, kur izcelti vislielāko izkliedes izmaiņu virzieni.

7) Algoritmi, kuru pamatā ir laika rindu prognozÄ“Å”ana

Ideja ir tāda, ka, ja vērtÄ«ba ir ārpus prognozÄ“Å”anas ticamÄ«bas intervāla, vērtÄ«ba tiek uzskatÄ«ta par anomālu. Lai prognozētu laikrindu, tiek izmantoti tādi algoritmi kā trÄ«skārŔā izlÄ«dzināŔana, S(ARIMA), pastiprināŔana utt.

Laikrindu prognozÄ“Å”anas algoritmi tika apspriesti iepriekŔējā rakstā.

9 pieejas anomāliju noteikŔanai

8) Uzraudzīta mācīŔanās (regresija, klasifikācija)

Ja dati ļauj, mēs izmantojam algoritmus, sākot no lineārās regresijas lÄ«dz atkārtotiem tÄ«kliem. IzmērÄ«sim starpÄ«bu starp prognozēto un faktisko vērtÄ«bu un izdarÄ«sim secinājumu, cik lielā mērā dati atŔķiras no normas. Ir svarÄ«gi, lai algoritmam bÅ«tu pietiekama vispārināŔanas spēja un lai apmācÄ«bas komplektā nebÅ«tu anomālu vērtÄ«bu.

9) Modeļu testi

Pieiesim anomāliju meklÄ“Å”anas problēmai kā ieteikumu meklÄ“Å”anas problēmai. SadalÄ«sim mÅ«su pazÄ«mju matricu, izmantojot SVD vai faktorizācijas maŔīnas, un uzskatÄ«sim par anomālām vērtÄ«bas jaunajā matricā, kas bÅ«tiski atŔķiras no sākotnējām.

9 pieejas anomāliju noteikŔanai

Attēls no dyakonov.org

Secinājums

Å ajā rakstā mēs apskatÄ«jām galvenās pieejas anomāliju noteikÅ”anai.

Anomāliju atraÅ”anu daudzējādā ziņā var saukt par mākslu. Nav ideāla algoritma vai pieejas, kuru izmantoÅ”ana atrisina visas problēmas. Biežāk konkrēta gadÄ«juma risināŔanai tiek izmantots metožu kopums. Anomāliju noteikÅ”ana tiek veikta, izmantojot vienas klases atbalsta vektoru maŔīnas, izolējot mežus, metriskās un klasteru metodes, kā arÄ« izmantojot galveno komponentu un laikrindu prognozÄ“Å”anu.

Ja zināt citas metodes, rakstiet par tām raksta komentāros.

Avots: www.habr.com

Pievieno komentāru