9 nga mga pamaagi aron mahibal-an ang mga anomaliya

Π’ miaging artikulo Naghisgot kami bahin sa panagna sa serye sa oras. Ang lohikal nga pagpadayon mahimong usa ka artikulo sa pag-ila sa mga anomaliya.

Paggamit

Ang pagtuki sa anomaliya gigamit sa mga lugar sama sa:

1) Pagtagna sa mga pagkaguba sa kagamitan

Busa, sa 2010, ang mga Iranian centrifuges giatake sa Stuxnet virus, nga nagtakda sa mga ekipo sa dili maayo nga operasyon ug gibalda ang pipila ka mga ekipo tungod sa paspas nga pagsul-ob.

Kung gigamit ang mga algorithm sa pagtuki sa anomaliya sa kagamitan, malikayan unta ang kahimtang sa kapakyasan.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

Ang pagpangita alang sa mga anomaliya sa operasyon sa mga ekipo gigamit dili lamang sa industriya sa nukleyar, kondili usab sa metalurhiya ug sa operasyon sa mga turbine sa ayroplano. Ug sa ubang mga dapit diin ang paggamit sa predictive diagnostics mas barato kay sa posible nga mga pagkawala tungod sa usa ka dili matag-an nga pagkahugno.

2) Pagtagna sa pagpanglimbong

Kung ang kwarta gikuha gikan sa kard nga imong gigamit sa Podolsk sa Albania, ang mga transaksyon mahimong kinahanglan nga susihon pag-ayo.

3) Pag-ila sa abnormal nga mga sumbanan sa konsyumer

Kung ang pipila ka mga kostumer nagpakita sa dili normal nga pamatasan, mahimong adunay problema nga wala nimo nahibal-an.

4) Pag-ila sa abnormal nga panginahanglan ug load

Kung ang pagbaligya sa usa ka tindahan sa FMCG mius-os ubos sa gilay-on sa pagsalig sa forecast, angay nga pangitaon ang hinungdan sa kung unsa ang nahitabo.

Mga pamaagi sa pag-ila sa mga anomaliya

1) Pagsuporta sa Vector Machine nga adunay Usa ka Klase Usa ka Klase nga SVM

Angayan kung ang datos sa set sa pagbansay nagsunod sa usa ka normal nga pag-apod-apod, apan ang set sa pagsulay adunay mga anomaliya.

Ang usa ka klase nga suporta nga vector machine nagtukod ug dili linear nga nawong sa palibot sa gigikanan. Posible nga magbutang ug cutoff limit diin ang data giisip nga anomalous.

Base sa kasinatian sa among DATA4 team, ang One-Class SVM mao ang kasagarang gigamit nga algorithm para sa pagsulbad sa problema sa pagpangita og mga anomaliya.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

2) I-isolate nga pamaagi sa lasang

Uban sa "random" nga pamaagi sa pagtukod sa mga kahoy, ang mga emisyon mosulod sa mga dahon sa unang mga hugna (sa usa ka mabaw nga giladmon sa kahoy), i.e. ang mga emisyon mas dali nga "ilain." Ang pag-inusara sa mga anomaliya nga mga kantidad mahitabo sa una nga mga pag-uli sa algorithm.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

3) Elliptic nga sobre ug mga pamaagi sa istatistika

Gigamit kung ang datos kay kasagarang giapod-apod. Ang mas duol sa sukod mao ang ikog sa sagol nga mga distribusyon, ang mas anomalous sa bili.

Ang ubang mga pamaagi sa istatistika mahimo usab nga ilakip sa kini nga klase.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

9 nga mga pamaagi aron mahibal-an ang mga anomaliya
Hulagway gikan sa dyakonov.org

4) Metriko nga mga pamaagi

Ang mga pamaagi naglakip sa mga algorithm sama sa k-pinakaduol nga silingan, k-pinakaduol nga silingan, ABOD (angle-based outlier detection) o LOF (local outlier factor).

Angayan kung ang distansya tali sa mga kantidad sa mga kinaiya katumbas o normal (aron dili masukod ang usa ka boa constrictor sa mga parrots).

Ang algorithm sa k-pinakaduol nga silingan nagtuo nga ang mga normal nga kantidad nahimutang sa usa ka rehiyon sa multidimensional nga wanang, ug ang gilay-on sa mga anomaliya mas dako kaysa sa nagbulag nga hyperplane.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

5) Mga pamaagi sa cluster

Ang esensya sa mga pamaagi sa cluster mao nga kung ang usa ka kantidad labaw pa sa usa ka piho nga kantidad gikan sa mga sentro sa cluster, ang kantidad mahimong isipon nga anomalous.

Ang nag-unang butang mao ang paggamit sa usa ka algorithm nga husto nga nagpundok sa datos, nga nagdepende sa piho nga buluhaton.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

6) Prinsipal nga sangkap nga pamaagi

Angayan diin ang mga direksyon sa pinakadako nga pagbag-o sa pagkatibulaag gipasiugda.

7) Algorithm base sa time series forecasting

Ang ideya mao nga kung ang usa ka kantidad nahulog sa gawas sa gilay-on nga pagsalig sa prediksyon, ang kantidad giisip nga anomalous. Aron matagna ang usa ka serye sa panahon, gigamit ang mga algorithm sama sa triple smoothing, S(ARIMA), boosting, ug uban pa.

Ang mga algorithm sa pagtagna sa serye sa oras gihisgutan sa miaging artikulo.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

8) Gibantayan nga pagkat-on (regression, klasipikasyon)

Kung gitugotan ang datos, mogamit kami mga algorithm gikan sa linear regression hangtod sa nagbalikbalik nga mga network. Atong sukdon ang kalainan tali sa panagna ug sa aktuwal nga bili, ug paghimog konklusyon kon unsa ka dako ang datos nga motipas gikan sa naandan. Importante nga ang algorithm adunay igong abilidad sa generalization ug nga ang training set walay anomalous nga mga bili.

9) Mga pagsulay sa modelo

Atong duolon ang problema sa pagpangita sa mga anomaliya isip problema sa pagpangita sa mga rekomendasyon. Atong i-decompose ang atong feature matrix gamit ang SVD o factorization machine, ug kuhaa ang mga value sa bag-ong matrix nga lahi kaayo sa orihinal kay anomalous.

9 nga mga pamaagi aron mahibal-an ang mga anomaliya

Hulagway gikan sa dyakonov.org

konklusyon

Niini nga artikulo, gisusi namon ang mga nag-unang pamaagi sa pag-ila sa anomaliya.

Ang pagpangita sa mga anomaliya sa daghang mga paagi matawag nga usa ka arte. Walay sulundon nga algorithm o pamaagi, ang paggamit niini makasulbad sa tanan nga mga problema. Kasagaran ang usa ka hugpong sa mga pamaagi gigamit aron masulbad ang usa ka piho nga kaso. Ang pagtuki sa anomaliya gihimo gamit ang usa ka klase nga suporta sa vector machine, pagbulag sa mga kalasangan, metric ug cluster nga mga pamaagi, ingon man ang paggamit sa mga punoan nga sangkap ug pagtagna sa serye sa oras.

Kung nahibal-an nimo ang ubang mga pamaagi, isulat ang bahin niini sa mga komento sa artikulo.

Source: www.habr.com

Idugang sa usa ka comment