В
Applicazione
A rilevazione di anomalie hè aduprata in spazii cum'è:
1) Previsione di guasti di l'equipaggiu
Cusì, in u 2010, i centrifugatori iraniani sò stati attaccati da u virus Stuxnet, chì hà stabilitu l'equipaggiu à un funziunamentu micca ottimali è hà disattivatu alcuni di l'equipaggiu per via di l'usura accelerata.
Se l'algoritmi di rilevazione di l'anomalie sò stati utilizati nantu à l'equipaggiu, a situazione di fallimentu puderia esse evitata.
A ricerca di anomalie in u funziunamentu di l'equipaggiu hè aduprata micca solu in l'industria nucleare, ma ancu in a metallurgia è l'operazione di turbine d'aviò. È in altri spazii induve l'usu di diagnostichi predittivi hè più prezzu di pèrdite pussibuli per via di una rottura imprevisible.
2) Previsione di fraud
Se i soldi sò ritirati da a carta chì utilizate in Podolsk in Albania, e transazzione ponu esse verificate più.
3) Identificazione di mudelli di cunsumatori anormali
Se certi clienti mostranu un cumpurtamentu anormale, pò esse un prublema chì ùn site micca cunuscenza.
4) Identificazione di dumanda è carica anormali
Se a vendita in una tenda FMCG hè cascata sottu à l'intervallu di cunfidenza di a previsione, vale a pena truvà u mutivu di ciò chì succede.
Approcci per identificà anomalie
1) Supportu Vector Machine cù One Class One-Class SVM
Adupratu quandu i dati in u gruppu di furmazione seguitanu una distribuzione normale, ma u gruppu di teste cuntene anomalie.
A macchina di vettore di supportu di una classe custruisce una superficia non lineare intornu à l'origine. Hè pussibule stabilisce un limitu di cutoff per quale dati hè cunsideratu anomalu.
Basatu nantu à l'esperienza di a nostra squadra DATA4, One-Class SVM hè l'algoritmu più cumunimenti utilizatu per risolve u prublema di truvà anomalie.
2) Isolate u metudu forestale
Cù u metudu "aleatoriu" di custruisce l'arburi, l'emissioni entreranu in e foglie in i primi tempi (à una prufundità pocu di l'arbulu), i.e. l'emissioni sò più faciuli da "isolà". L'isolazione di i valori anomali si trova in e prime iterazioni di l'algoritmu.
3) Envelope ellittica è metudi statistichi
Adupratu quandu i dati sò generalmente distribuiti. A più vicinu à a misurazione di a cuda di a mistura di distribuzione, u più anomalu u valore.
Altri metudi statistichi ponu ancu esse inclusi in questa classa.
Image da dyakonov.org
4) metudi metrica
I metudi includenu algoritmi cum'è k-vicini più vicini, k-vicini più vicini, ABOD (detection outlier-based angle) o LOF (fattore di outlier locale).
Adupratu se a distanza trà i valori in e caratteristiche sò equivalenti o nurmalizzati (per ùn misurà una boa constrictor in pappagalli).
L'algoritmu di k-vicini più vicini assume chì i valori normali sò situati in una certa regione di u spaziu multidimensionale, è a distanza à l'anomali serà più grande ch'è à l'iperpianu di separazione.
5) metudi cluster
L'essenza di i metudi di cluster hè chì se un valore hè più di una certa quantità di distanza da i centri di cluster, u valore pò esse cunsideratu anomalu.
A cosa principal hè di utilizà un algoritmu chì raggruppa currettamente i dati, chì dipende da u compitu specificu.
6) Metudu cumpunenti principali
Adatta induve e direzzione di u più grande cambiamentu di dispersione sò evidenziate.
7) Algoritmi basati nantu à a previsione di serie temporale
L'idea hè chì se un valore cade fora di l'intervallu di cunfidenza di prediczione, u valore hè cunsideratu anomalu. Per predichendu una serie di tempu, l'algoritmi cum'è u triple smoothing, S (ARIMA), boosting, etc.
L'algoritmi di previsione di serie di u tempu sò stati discututi in l'articulu precedente.
8) Apprendimentu supervisatu (regressione, classificazione)
Se i dati permettenu, usemu algoritmi chì varienu da a regressione lineale à e rete recurrenti. Misuremu a diffarenza trà a prediczione è u valore attuale, è fate una cunclusione in quantu i dati sviate da a norma. Hè impurtante chì l'algoritmu hà una capacità di generalizazione abbastanza è chì u gruppu di furmazione ùn cuntene micca valori anomali.
9) Test di mudellu
Avvicinemu u prublema di a ricerca di anomalie cum'è un prublema di ricerca di cunsiglii. Decomponemu a nostra matrice di funzioni usendu SVD o macchine di factorizazione, è pigliate i valori in a nova matrice chì sò significativamente diversi da quelli originali cum'è anomali.
Image da dyakonov.org
cunchiusioni
In questu articulu, avemu rivisatu i principali approcci à a rilevazione di anomalie.
Truvà anomalie pò in parechje manere esse chjamatu arti. Ùn ci hè micca un algoritmu o avvicinamentu ideale, l'usu di quale risolve tutti i prublemi. Più spessu, un inseme di metudi hè utilizatu per risolve un casu specificu. A rilevazione di l'anomalie hè realizata aduprendu macchine vettoriali di supportu di una sola classe, isolando i boschi, metudi metrici è cluster, è ancu utilizendu cumpunenti principali è previsioni di serie temporali.
Se sapete altri metudi, scrivite nantu à elli in i cumenti à l'articulu.
Source: www.habr.com