Π
Aplikasi
Deteksi anomali digunakake ing wilayah kayata:
1) Prediksi kerusakan peralatan
Mangkono, ing 2010, sentrifugal Iran diserang dening virus Stuxnet, sing nyetel peralatan kanggo operasi sing ora optimal lan mateni sawetara peralatan amarga nyandhang kanthi cepet.
Yen algoritma deteksi anomali wis digunakake ing peralatan kasebut, kahanan gagal bisa dihindari.
Panelusuran anomali ing operasi peralatan digunakake ora mung ing industri nuklir, nanging uga ing metalurgi lan operasi turbin pesawat. Lan ing wilayah liyane sing nggunakake diagnostik prediktif luwih murah tinimbang kerugian sing bisa ditindakake amarga rusak sing ora bisa ditebak.
2) Prediksi penipuan
Yen dhuwit ditarik saka kertu sing sampeyan gunakake ing Podolsk ing Albania, transaksi kasebut bisa uga kudu dipriksa luwih lanjut.
3) Identifikasi pola konsumen sing ora normal
Yen sawetara pelanggan nuduhake prilaku ora normal, bisa uga ana masalah sing sampeyan ora ngerti.
4) Identifikasi permintaan lan beban sing ora normal
Yen dodolan ing toko FMCG wis mudhun ing ngisor interval kapercayan ramalan, mula kudu golek alesan kanggo kedadeyan kasebut.
Pendekatan kanggo ngenali anomali
1) Dhukungan Mesin Vektor kanthi SVM Kelas Siji
Cocog nalika data ing set latihan nderek distribusi normal, nanging set test ngandhut anomali.
Mesin vektor dhukungan kelas siji nggawe permukaan nonlinear ing sekitar asale. Sampeyan bisa nyetel wates cutoff sing data dianggep anomali.
Adhedhasar pengalaman tim DATA4 kita, One-Class SVM minangka algoritma sing paling umum digunakake kanggo ngrampungake masalah nemokake anomali.
2) Metode isolasi alas
Kanthi cara "acak" kanggo mbangun wit, emisi bakal mlebu ing godhong ing tahap awal (ing ambane wit sing cethek), i.e. emisi luwih gampang "diisolasi." Isolasi nilai anomali dumadi ing iterasi pisanan saka algoritma.
3) Amplop eliptik lan metode statistik
Digunakake nalika data distribusi normal. Sing luwih cedhak karo pangukuran menyang buntut saka campuran distribusi, luwih anomali nilai kasebut.
Cara statistik liyane uga bisa dilebokake ing kelas iki.
Gambar saka dyakonov.org
4) Metode metrik
Metode kalebu algoritma kayata k-nearest neighbors, k-nearrest neighbor, ABOD (angle-based outlier detection) utawa LOF (local outlier factor).
Cocog yen jarak antarane nilai ing karakteristik padha utawa normal (supaya ora ngukur boa constrictor ing parrots).
Algoritma tetanggan k-paling cedhak nganggep yen nilai normal dumunung ing wilayah multidimensi tartamtu, lan jarak menyang anomali bakal luwih gedhe tinimbang hyperplane sing misahake.
5) Metode klaster
Inti saka metode kluster yaiku yen nilai luwih saka jumlah tartamtu adoh saka pusat kluster, nilai kasebut bisa dianggep anomali.
Sing utama yaiku nggunakake algoritma sing nglumpukake data kanthi bener, sing gumantung saka tugas tartamtu.
6) Metode komponen pokok
Cocog ing ngendi arah owah-owahan paling gedhe ing dispersi disorot.
7) Algoritma adhedhasar prakiraan time series
Ide kasebut yaiku yen nilai kasebut ana ing njaba interval kapercayan prediksi, nilai kasebut dianggep anomali. Kanggo prΓ©dhiksi seri wektu, algoritma kayata smoothing triple, S(ARIMA), boosting, lsp.
Algoritma ramalan seri wektu wis dibahas ing artikel sadurunge.
8) Pembelajaran sing diawasi (regresi, klasifikasi)
Yen data ngidini, kita nggunakake algoritma wiwit saka regresi linear kanggo jaringan ambalan. Ayo padha ngukur prabΓ©dan antarane prediksi lan nilai nyata, lan tarik kesimpulan kanggo apa ombone data nyimpang saka norma. Penting yen algoritma nduweni kemampuan generalisasi sing cukup lan set latihan ora ngemot nilai anomali.
9) Tes model
Ayo nyedhaki masalah nggoleki anomali minangka masalah nggoleki rekomendasi. Ayo decompose matriks fitur kita nggunakake mesin SVD utawa faktorisasi, lan njupuk nilai ing matriks anyar sing beda banget saka sing asli minangka anomali.
Gambar saka dyakonov.org
kesimpulan
Ing artikel iki, kita nliti pendekatan utama kanggo deteksi anomali.
Nemokake anomali bisa kanthi pirang-pirang cara diarani seni. Ora ana algoritma utawa pendekatan sing cocog, panggunaan sing bisa ngrampungake kabeh masalah. Luwih kerep sawetara cara digunakake kanggo ngatasi kasus tartamtu. Deteksi anomali ditindakake kanthi nggunakake mesin vektor dhukungan kelas siji, ngisolasi alas, metode metrik lan kluster, uga nggunakake komponen utama lan ramalan seri wektu.
Yen sampeyan ngerti cara liyane, tulis babagan kasebut ing komentar ing artikel kasebut.
Source: www.habr.com