അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

В മുമ്പത്തെ ലേഖനം ഞങ്ങൾ സമയ പരമ്പര പ്രവചനത്തെക്കുറിച്ച് സംസാരിച്ചു. ഒരു ലോജിക്കൽ തുടർച്ച എന്നത് അപാകതകൾ തിരിച്ചറിയുന്നതിനുള്ള ഒരു ലേഖനമായിരിക്കും.

അപേക്ഷ

അനോമലി ഡിറ്റക്ഷൻ ഇനിപ്പറയുന്നതുപോലുള്ള മേഖലകളിൽ ഉപയോഗിക്കുന്നു:

1) ഉപകരണങ്ങളുടെ തകരാറുകളുടെ പ്രവചനം

അങ്ങനെ, 2010-ൽ, ഇറാനിയൻ സെൻട്രിഫ്യൂജുകളെ സ്റ്റക്‌സ്‌നെറ്റ് വൈറസ് ആക്രമിച്ചു, ഇത് ഉപകരണങ്ങളെ ഒപ്റ്റിമൽ അല്ലാത്ത പ്രവർത്തനത്തിലേക്ക് സജ്ജമാക്കുകയും ത്വരിതപ്പെടുത്തിയ വസ്ത്രങ്ങൾ കാരണം ചില ഉപകരണങ്ങളെ പ്രവർത്തനരഹിതമാക്കുകയും ചെയ്തു.

അനോമലി ഡിറ്റക്ഷൻ അൽഗോരിതങ്ങൾ ഉപകരണങ്ങളിൽ ഉപയോഗിച്ചിരുന്നെങ്കിൽ, പരാജയം ഒഴിവാക്കാമായിരുന്നു.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

ഉപകരണങ്ങളുടെ പ്രവർത്തനത്തിലെ അപാകതകൾക്കായുള്ള തിരയൽ ആണവ വ്യവസായത്തിൽ മാത്രമല്ല, ലോഹശാസ്ത്രത്തിലും വിമാന ടർബൈനുകളുടെ പ്രവർത്തനത്തിലും ഉപയോഗിക്കുന്നു. പ്രവചനാതീതമായ തകർച്ച കാരണം സാധ്യമായ നഷ്ടങ്ങളേക്കാൾ വിലകുറഞ്ഞ പ്രവചന ഡയഗ്നോസ്റ്റിക്സിന്റെ ഉപയോഗം മറ്റ് മേഖലകളിൽ.

2) തട്ടിപ്പ് പ്രവചനം

അൽബേനിയയിലെ പോഡോൾസ്കിൽ നിങ്ങൾ ഉപയോഗിക്കുന്ന കാർഡിൽ നിന്ന് പണം പിൻവലിക്കുകയാണെങ്കിൽ, ഇടപാടുകൾ കൂടുതൽ പരിശോധിക്കേണ്ടതായി വന്നേക്കാം.

3) അസാധാരണമായ ഉപഭോക്തൃ പാറ്റേണുകളുടെ തിരിച്ചറിയൽ

ചില ഉപഭോക്താക്കൾ അസാധാരണമായ പെരുമാറ്റം പ്രകടിപ്പിക്കുകയാണെങ്കിൽ, നിങ്ങൾ അറിയാത്ത ഒരു പ്രശ്നം ഉണ്ടായേക്കാം.

4) അസാധാരണമായ ഡിമാൻഡും ലോഡും തിരിച്ചറിയൽ

ഒരു എഫ്എംസിജി സ്റ്റോറിലെ വിൽപ്പന പ്രവചനത്തിന്റെ ആത്മവിശ്വാസ ഇടവേളയ്ക്ക് താഴെയായി കുറഞ്ഞിട്ടുണ്ടെങ്കിൽ, എന്താണ് സംഭവിക്കുന്നതെന്ന് കണ്ടെത്തുന്നത് മൂല്യവത്താണ്.

അപാകതകൾ തിരിച്ചറിയുന്നതിനുള്ള സമീപനങ്ങൾ

1) വൺ ക്ലാസ് വൺ-ക്ലാസ് SVM ഉള്ള വെക്റ്റർ മെഷീൻ സപ്പോർട്ട് ചെയ്യുക

പരിശീലന സെറ്റിലെ ഡാറ്റ ഒരു സാധാരണ വിതരണത്തെ പിന്തുടരുമ്പോൾ അനുയോജ്യം, എന്നാൽ ടെസ്റ്റ് സെറ്റിൽ അപാകതകൾ അടങ്ങിയിരിക്കുന്നു.

വൺ-ക്ലാസ് സപ്പോർട്ട് വെക്റ്റർ മെഷീൻ ഉത്ഭവത്തിന് ചുറ്റും ഒരു നോൺ-ലീനിയർ ഉപരിതലം നിർമ്മിക്കുന്നു. ഡാറ്റ അസാധാരണമായി കണക്കാക്കുന്ന ഒരു കട്ട്ഓഫ് പരിധി സജ്ജീകരിക്കാൻ കഴിയും.

ഞങ്ങളുടെ DATA4 ടീമിന്റെ അനുഭവത്തെ അടിസ്ഥാനമാക്കി, അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നതിന് ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന അൽഗോരിതം ആണ് വൺ-ക്ലാസ് SVM.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

2) ഒറ്റപ്പെട്ട വന രീതി

മരങ്ങൾ നിർമ്മിക്കുന്നതിനുള്ള "റാൻഡം" രീതി ഉപയോഗിച്ച്, ഉദ്വമനം ആദ്യഘട്ടങ്ങളിൽ ഇലകളിൽ പ്രവേശിക്കും (മരത്തിന്റെ ആഴം കുറഞ്ഞ ആഴത്തിൽ), അതായത്. ഉദ്‌വമനം "ഒറ്റപ്പെടുത്താൻ" എളുപ്പമാണ്. അൽഗോരിതത്തിന്റെ ആദ്യ ആവർത്തനങ്ങളിൽ അസാധാരണ മൂല്യങ്ങളുടെ ഒറ്റപ്പെടൽ സംഭവിക്കുന്നു.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

3) എലിപ്റ്റിക് എൻവലപ്പും സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികളും

ഡാറ്റ സാധാരണയായി വിതരണം ചെയ്യുമ്പോൾ ഉപയോഗിക്കുന്നു. വിതരണങ്ങളുടെ മിശ്രിതത്തിന്റെ വാലുമായി അടുത്ത അളവെടുക്കൽ, മൂല്യം കൂടുതൽ അസ്വാഭാവികമാണ്.

മറ്റ് സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികളും ഈ ക്ലാസിൽ ഉൾപ്പെടുത്താം.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ
dyakonov.org-ൽ നിന്നുള്ള ചിത്രം

4) മെട്രിക് രീതികൾ

കെ-സമീപത്തുള്ള അയൽക്കാർ, കെ-അടുത്ത അയൽക്കാരൻ, ABOD (ആംഗിൾ അടിസ്ഥാനമാക്കിയുള്ള ഔട്ട്‌ലിയർ കണ്ടെത്തൽ) അല്ലെങ്കിൽ LOF (ലോക്കൽ ഔട്ട്‌ലിയർ ഫാക്ടർ) പോലുള്ള അൽഗോരിതങ്ങൾ രീതികളിൽ ഉൾപ്പെടുന്നു.

സ്വഭാവസവിശേഷതകളിലെ മൂല്യങ്ങൾ തമ്മിലുള്ള ദൂരം തുല്യമോ സാധാരണമോ ആണെങ്കിൽ അനുയോജ്യം (തത്തകളിൽ ഒരു ബോവ കൺസ്ട്രക്റ്റർ അളക്കാതിരിക്കാൻ).

കെ-സമീപത്തുള്ള അയൽവാസികളുടെ അൽഗോരിതം അനുമാനിക്കുന്നത് സാധാരണ മൂല്യങ്ങൾ മൾട്ടിഡൈമൻഷണൽ സ്പേസിന്റെ ഒരു പ്രത്യേക മേഖലയിൽ സ്ഥിതി ചെയ്യുന്നു, കൂടാതെ അപാകതകളിലേക്കുള്ള ദൂരം വേർതിരിക്കുന്ന ഹൈപ്പർപ്ലെയിനേക്കാൾ കൂടുതലായിരിക്കും.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

5) ക്ലസ്റ്റർ രീതികൾ

ക്ലസ്റ്റർ രീതികളുടെ സാരം, ഒരു മൂല്യം ക്ലസ്റ്റർ കേന്ദ്രങ്ങളിൽ നിന്ന് ഒരു നിശ്ചിത തുകയിൽ കൂടുതൽ അകലെയാണെങ്കിൽ, മൂല്യം അസാധാരണമായി കണക്കാക്കാം എന്നതാണ്.

നിർദ്ദിഷ്ട ടാസ്ക്കിനെ ആശ്രയിച്ചിരിക്കുന്ന ഡാറ്റയെ ശരിയായി ക്ലസ്റ്ററുകൾ ചെയ്യുന്ന ഒരു അൽഗോരിതം ഉപയോഗിക്കുക എന്നതാണ് പ്രധാന കാര്യം.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

6) പ്രധാന ഘടകം രീതി

ചിതറിക്കലിലെ ഏറ്റവും വലിയ മാറ്റത്തിന്റെ ദിശകൾ ഹൈലൈറ്റ് ചെയ്യുന്നിടത്ത് അനുയോജ്യം.

7) സമയ ശ്രേണി പ്രവചനത്തെ അടിസ്ഥാനമാക്കിയുള്ള അൽഗോരിതങ്ങൾ

ഒരു മൂല്യം പ്രവചന ആത്മവിശ്വാസ ഇടവേളയ്ക്ക് പുറത്ത് വീഴുകയാണെങ്കിൽ, മൂല്യം അസാധാരണമായി കണക്കാക്കപ്പെടുന്നു എന്നതാണ് ആശയം. ഒരു സമയ ശ്രേണി പ്രവചിക്കാൻ, ട്രിപ്പിൾ സ്മൂത്തിംഗ്, S(ARIMA), ബൂസ്റ്റിംഗ് മുതലായവ പോലുള്ള അൽഗോരിതങ്ങൾ ഉപയോഗിക്കുന്നു.

ടൈം സീരീസ് പ്രവചന അൽഗോരിതങ്ങൾ മുൻ ലേഖനത്തിൽ ചർച്ച ചെയ്തു.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

8) മേൽനോട്ടത്തിലുള്ള പഠനം (റിഗ്രഷൻ, വർഗ്ഗീകരണം)

ഡാറ്റ അനുവദിക്കുകയാണെങ്കിൽ, ലീനിയർ റിഗ്രഷൻ മുതൽ ആവർത്തന നെറ്റ്‌വർക്കുകൾ വരെയുള്ള അൽഗോരിതങ്ങൾ ഞങ്ങൾ ഉപയോഗിക്കുന്നു. പ്രവചനവും യഥാർത്ഥ മൂല്യവും തമ്മിലുള്ള വ്യത്യാസം നമുക്ക് അളക്കാം, കൂടാതെ ഡാറ്റ മാനദണ്ഡത്തിൽ നിന്ന് എത്രത്തോളം വ്യതിചലിക്കുന്നുവെന്ന് ഒരു നിഗമനത്തിലെത്താം. അൽഗോരിതത്തിന് മതിയായ സാമാന്യവൽക്കരണ ശേഷി ഉണ്ടെന്നതും പരിശീലന സെറ്റിൽ അസാധാരണ മൂല്യങ്ങൾ അടങ്ങിയിട്ടില്ലെന്നതും പ്രധാനമാണ്.

9) മോഡൽ ടെസ്റ്റുകൾ

ശുപാർശകൾക്കായി തിരയുന്നതിലെ ഒരു പ്രശ്നമായി അപാകതകൾക്കായി തിരയുന്ന പ്രശ്നത്തെ സമീപിക്കാം. നമുക്ക് SVD അല്ലെങ്കിൽ ഫാക്‌ടറൈസേഷൻ മെഷീനുകൾ ഉപയോഗിച്ച് ഞങ്ങളുടെ ഫീച്ചർ മാട്രിക്‌സ് വിഘടിപ്പിക്കാം, കൂടാതെ പുതിയ മാട്രിക്‌സിലെ മൂല്യങ്ങൾ ഒറിജിനലിൽ നിന്ന് കാര്യമായി വ്യത്യാസപ്പെട്ടിരിക്കുന്നു.

അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള 9 സമീപനങ്ങൾ

dyakonov.org-ൽ നിന്നുള്ള ചിത്രം

തീരുമാനം

ഈ ലേഖനത്തിൽ, അപാകത കണ്ടെത്തുന്നതിനുള്ള പ്രധാന സമീപനങ്ങൾ ഞങ്ങൾ അവലോകനം ചെയ്തു.

അപാകതകൾ കണ്ടെത്തുന്നതിനെ പല തരത്തിൽ ഒരു കല എന്ന് വിളിക്കാം. അനുയോജ്യമായ അൽഗോരിതം അല്ലെങ്കിൽ സമീപനം ഇല്ല, അതിന്റെ ഉപയോഗം എല്ലാ പ്രശ്നങ്ങളും പരിഹരിക്കുന്നു. ഒരു നിർദ്ദിഷ്ട കേസ് പരിഹരിക്കാൻ പലപ്പോഴും ഒരു കൂട്ടം രീതികൾ ഉപയോഗിക്കുന്നു. വൺ-ക്ലാസ് സപ്പോർട്ട് വെക്റ്റർ മെഷീനുകൾ, വനങ്ങളെ ഒറ്റപ്പെടുത്തൽ, മെട്രിക്, ക്ലസ്റ്റർ രീതികൾ, പ്രധാന ഘടകങ്ങളും സമയ ശ്രേണി പ്രവചനവും ഉപയോഗിച്ചാണ് അപാകത കണ്ടെത്തൽ നടത്തുന്നത്.

നിങ്ങൾക്ക് മറ്റ് രീതികൾ അറിയാമെങ്കിൽ, ലേഖനത്തിലെ അഭിപ്രായങ്ങളിൽ അവയെക്കുറിച്ച് എഴുതുക.

അവലംബം: www.habr.com

ഒരു അഭിപ്രായം ചേർക്കുക