9 approċċi biex jinstabu anomaliji

В artikolu preċedenti tkellimna dwar it-tbassir tas-serje tal-ħin. Kontinwazzjoni loġika tkun artiklu dwar l-identifikazzjoni ta' anomaliji.

Applikazzjoni

Is-sejbien ta' anomaliji jintuża f'oqsma bħal:

1) Tbassir ta 'ħsarat tat-tagħmir

Għalhekk, fl-2010, ċentrifugi Iranjani ġew attakkati mill-virus Stuxnet, li stabbilixxa t-tagħmir għal tħaddim mhux ottimali u ddiżattiva xi wħud mit-tagħmir minħabba xedd aċċellerat.

Kieku ntużaw algoritmi ta' skoperta ta' anomaliji fuq it-tagħmir, is-sitwazzjoni ta' falliment setgħet tiġi evitata.

9 approċċi biex jinstabu anomaliji

It-tfittxija għal anomaliji fl-operat tat-tagħmir tintuża mhux biss fl-industrija nukleari, iżda wkoll fil-metallurġija u l-operat tat-turbini tal-inġenji tal-ajru. U f'oqsma oħra fejn l-użu ta 'dijanjostika ta' tbassir huwa orħos minn telf possibbli minħabba tqassim imprevedibbli.

2) Tbassir ta 'frodi

Jekk il-flus jiġu rtirati mill-karta li tuża f'Podolsk fl-Albanija, it-tranżazzjonijiet jista' jkollhom bżonn jiġu ċċekkjati aktar.

3) Identifikazzjoni ta 'mudelli anormali tal-konsumatur

Jekk xi klijenti juru imġieba anormali, jista 'jkun hemm problema li ma tkunx taf biha.

4) Identifikazzjoni ta 'domanda u tagħbija anormali

Jekk il-bejgħ f'ħanut FMCG niżel taħt l-intervall ta 'kunfidenza tat-tbassir, ta' min isib ir-raġuni għal dak li qed jiġri.

Approċċi għall-identifikazzjoni ta' anomaliji

1) Appoġġ Magni tal-Vector b'SVM ta 'Klassi Waħda ta' Klassi Waħda

Adattat meta d-dejta fis-sett tat-taħriġ issegwi distribuzzjoni normali, iżda s-sett tat-test ikun fih anomaliji.

Il-magna tal-vettur ta 'appoġġ ta' klassi waħda tibni wiċċ mhux lineari madwar l-oriġini. Huwa possibbli li jiġi stabbilit limitu ta' qtugħ li għalih id-dejta titqies bħala anomala.

Ibbażat fuq l-esperjenza tat-tim DATA4 tagħna, One-Class SVM huwa l-algoritmu l-aktar użat komunement biex issolvi l-problema tas-sejba ta 'anomaliji.

9 approċċi biex jinstabu anomaliji

2) Iżola l-metodu tal-foresti

Bil-metodu "addoċċ" tal-kostruzzjoni tas-siġar, l-emissjonijiet se jidħlu fil-weraq fi stadji bikrija (f'fond baxx tas-siġra), i.e. l-emissjonijiet huma aktar faċli biex "jiżolaw." L-iżolament ta 'valuri anomali jseħħ fl-ewwel iterazzjonijiet tal-algoritmu.

9 approċċi biex jinstabu anomaliji

3) Pakkett ellittiku u metodi statistiċi

Użat meta d-data hija normalment distribwita. L-eqreb il-kejl ikun lejn id-denb tat-taħlita ta 'distribuzzjonijiet, aktar ikun anomalu l-valur.

Jistgħu jiġu inklużi wkoll metodi statistiċi oħra f'din il-klassi.

9 approċċi biex jinstabu anomaliji

9 approċċi biex jinstabu anomaliji
Immaġni minn dyakonov.org

4) Metodi metriċi

Il-metodi jinkludu algoritmi bħal k-nearest neighbors, k-nearest neighbor, ABOD (skoperta ta 'outlier ibbażata fuq l-angolu) jew LOF (fattur lokali outlier).

Adattat jekk id-distanza bejn il-valuri fil-karatteristiċi tkun ekwivalenti jew normalizzata (sabiex ma titkejjel boa constrictor fil-pappagalli).

L-algoritmu tal-ġirien k-eqreb jassumi li l-valuri normali jinsabu f'ċertu reġjun ta 'spazju multidimensjonali, u d-distanza għall-anomaliji tkun akbar milli għall-iperpjan li jissepara.

9 approċċi biex jinstabu anomaliji

5) Metodi ta 'cluster

L-essenza tal-metodi tal-cluster hija li jekk valur ikun aktar minn ċertu ammont 'il bogħod miċ-ċentri tal-cluster, il-valur jista' jitqies bħala anomali.

Il-ħaġa prinċipali hija li tuża algoritmu li jiġbor id-dejta b'mod korrett, li jiddependi fuq il-kompitu speċifiku.

9 approċċi biex jinstabu anomaliji

6) Metodu tal-komponent prinċipali

Adattat fejn id-direzzjonijiet tal-akbar bidla fid-dispersjoni huma enfasizzati.

7) Algoritmi bbażati fuq it-tbassir tas-serje tal-ħin

L-idea hija li jekk valur jaqa 'barra mill-intervall ta' kunfidenza tat-tbassir, il-valur jitqies bħala anomali. Biex tbassar serje ta 'żmien, jintużaw algoritmi bħal triple smoothing, S(ARIMA), boosting, eċċ.

L-algoritmi tat-tbassir tas-serje tal-ħin ġew diskussi fl-artikolu preċedenti.

9 approċċi biex jinstabu anomaliji

8) Tagħlim sorveljat (rigressjoni, klassifikazzjoni)

Jekk id-dejta tippermetti, nużaw algoritmi li jvarjaw minn rigressjoni lineari għal netwerks rikorrenti. Ejja nkejlu d-differenza bejn it-tbassir u l-valur attwali, u iġbed konklużjoni sa liema punt id-dejta tiddevja min-norma. Huwa importanti li l-algoritmu jkollu biżżejjed kapaċità ta 'ġeneralizzazzjoni u li s-sett ta' taħriġ ma jkunx fih valuri anomali.

9) Testijiet tal-mudell

Ejja nersqu lejn il-problema tat-tiftix għal anomaliji bħala problema ta 'tiftix għal rakkomandazzjonijiet. Ejja niddekomponu l-matriċi tal-karatteristiċi tagħna billi tuża magni SVD jew ta 'fatturizzazzjoni, u nieħdu l-valuri fil-matriċi l-ġdida li huma differenti b'mod sinifikanti minn dawk oriġinali bħala anomali.

9 approċċi biex jinstabu anomaliji

Immaġni minn dyakonov.org

Konklużjoni

F'dan l-artikolu, aħna rrevejna l-approċċi ewlenin għall-iskoperta ta 'anomalija.

Is-sejba ta' anomaliji tista' f'ħafna modi tissejjaħ arti. M'hemm l-ebda algoritmu jew approċċ ideali, li l-użu tiegħu jsolvi l-problemi kollha. Iktar spiss jintuża sett ta' metodi biex isolvi każ speċifiku. Is-sejbien ta' anomaliji jitwettaq bl-użu ta' magni ta' vettur ta' appoġġ ta' klassi waħda, foresti iżolati, metodi metriċi u cluster, kif ukoll bl-użu ta' komponenti prinċipali u tbassir ta' serje ta' żmien.

Jekk taf metodi oħra, ikteb dwarhom fil-kummenti għall-artiklu.

Sors: www.habr.com

Żid kumment