В
അപേക്ഷ
അനോമലി ഡിറ്റക്ഷൻ ഇനിപ്പറയുന്നതുപോലുള്ള മേഖലകളിൽ ഉപയോഗിക്കുന്നു:
1) ഉപകരണങ്ങളുടെ തകരാറുകളുടെ പ്രവചനം
അങ്ങനെ, 2010-ൽ, ഇറാനിയൻ സെൻട്രിഫ്യൂജുകളെ സ്റ്റക്സ്നെറ്റ് വൈറസ് ആക്രമിച്ചു, ഇത് ഉപകരണങ്ങളെ ഒപ്റ്റിമൽ അല്ലാത്ത പ്രവർത്തനത്തിലേക്ക് സജ്ജമാക്കുകയും ത്വരിതപ്പെടുത്തിയ വസ്ത്രങ്ങൾ കാരണം ചില ഉപകരണങ്ങളെ പ്രവർത്തനരഹിതമാക്കുകയും ചെയ്തു.
അനോമലി ഡിറ്റക്ഷൻ അൽഗോരിതങ്ങൾ ഉപകരണങ്ങളിൽ ഉപയോഗിച്ചിരുന്നെങ്കിൽ, പരാജയം ഒഴിവാക്കാമായിരുന്നു.
ഉപകരണങ്ങളുടെ പ്രവർത്തനത്തിലെ അപാകതകൾക്കായുള്ള തിരയൽ ആണവ വ്യവസായത്തിൽ മാത്രമല്ല, ലോഹശാസ്ത്രത്തിലും വിമാന ടർബൈനുകളുടെ പ്രവർത്തനത്തിലും ഉപയോഗിക്കുന്നു. പ്രവചനാതീതമായ തകർച്ച കാരണം സാധ്യമായ നഷ്ടങ്ങളേക്കാൾ വിലകുറഞ്ഞ പ്രവചന ഡയഗ്നോസ്റ്റിക്സിന്റെ ഉപയോഗം മറ്റ് മേഖലകളിൽ.
2) തട്ടിപ്പ് പ്രവചനം
അൽബേനിയയിലെ പോഡോൾസ്കിൽ നിങ്ങൾ ഉപയോഗിക്കുന്ന കാർഡിൽ നിന്ന് പണം പിൻവലിക്കുകയാണെങ്കിൽ, ഇടപാടുകൾ കൂടുതൽ പരിശോധിക്കേണ്ടതായി വന്നേക്കാം.
3) അസാധാരണമായ ഉപഭോക്തൃ പാറ്റേണുകളുടെ തിരിച്ചറിയൽ
ചില ഉപഭോക്താക്കൾ അസാധാരണമായ പെരുമാറ്റം പ്രകടിപ്പിക്കുകയാണെങ്കിൽ, നിങ്ങൾ അറിയാത്ത ഒരു പ്രശ്നം ഉണ്ടായേക്കാം.
4) അസാധാരണമായ ഡിമാൻഡും ലോഡും തിരിച്ചറിയൽ
ഒരു എഫ്എംസിജി സ്റ്റോറിലെ വിൽപ്പന പ്രവചനത്തിന്റെ ആത്മവിശ്വാസ ഇടവേളയ്ക്ക് താഴെയായി കുറഞ്ഞിട്ടുണ്ടെങ്കിൽ, എന്താണ് സംഭവിക്കുന്നതെന്ന് കണ്ടെത്തുന്നത് മൂല്യവത്താണ്.
അപാകതകൾ തിരിച്ചറിയുന്നതിനുള്ള സമീപനങ്ങൾ
1) വൺ ക്ലാസ് വൺ-ക്ലാസ് SVM ഉള്ള വെക്റ്റർ മെഷീൻ സപ്പോർട്ട് ചെയ്യുക
പരിശീലന സെറ്റിലെ ഡാറ്റ ഒരു സാധാരണ വിതരണത്തെ പിന്തുടരുമ്പോൾ അനുയോജ്യം, എന്നാൽ ടെസ്റ്റ് സെറ്റിൽ അപാകതകൾ അടങ്ങിയിരിക്കുന്നു.
വൺ-ക്ലാസ് സപ്പോർട്ട് വെക്റ്റർ മെഷീൻ ഉത്ഭവത്തിന് ചുറ്റും ഒരു നോൺ-ലീനിയർ ഉപരിതലം നിർമ്മിക്കുന്നു. ഡാറ്റ അസാധാരണമായി കണക്കാക്കുന്ന ഒരു കട്ട്ഓഫ് പരിധി സജ്ജീകരിക്കാൻ കഴിയും.
ഞങ്ങളുടെ DATA4 ടീമിന്റെ അനുഭവത്തെ അടിസ്ഥാനമാക്കി, അപാകതകൾ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നതിന് ഏറ്റവും സാധാരണയായി ഉപയോഗിക്കുന്ന അൽഗോരിതം ആണ് വൺ-ക്ലാസ് SVM.
2) ഒറ്റപ്പെട്ട വന രീതി
മരങ്ങൾ നിർമ്മിക്കുന്നതിനുള്ള "റാൻഡം" രീതി ഉപയോഗിച്ച്, ഉദ്വമനം ആദ്യഘട്ടങ്ങളിൽ ഇലകളിൽ പ്രവേശിക്കും (മരത്തിന്റെ ആഴം കുറഞ്ഞ ആഴത്തിൽ), അതായത്. ഉദ്വമനം "ഒറ്റപ്പെടുത്താൻ" എളുപ്പമാണ്. അൽഗോരിതത്തിന്റെ ആദ്യ ആവർത്തനങ്ങളിൽ അസാധാരണ മൂല്യങ്ങളുടെ ഒറ്റപ്പെടൽ സംഭവിക്കുന്നു.
3) എലിപ്റ്റിക് എൻവലപ്പും സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികളും
ഡാറ്റ സാധാരണയായി വിതരണം ചെയ്യുമ്പോൾ ഉപയോഗിക്കുന്നു. വിതരണങ്ങളുടെ മിശ്രിതത്തിന്റെ വാലുമായി അടുത്ത അളവെടുക്കൽ, മൂല്യം കൂടുതൽ അസ്വാഭാവികമാണ്.
മറ്റ് സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികളും ഈ ക്ലാസിൽ ഉൾപ്പെടുത്താം.
dyakonov.org-ൽ നിന്നുള്ള ചിത്രം
4) മെട്രിക് രീതികൾ
കെ-സമീപത്തുള്ള അയൽക്കാർ, കെ-അടുത്ത അയൽക്കാരൻ, ABOD (ആംഗിൾ അടിസ്ഥാനമാക്കിയുള്ള ഔട്ട്ലിയർ കണ്ടെത്തൽ) അല്ലെങ്കിൽ LOF (ലോക്കൽ ഔട്ട്ലിയർ ഫാക്ടർ) പോലുള്ള അൽഗോരിതങ്ങൾ രീതികളിൽ ഉൾപ്പെടുന്നു.
സ്വഭാവസവിശേഷതകളിലെ മൂല്യങ്ങൾ തമ്മിലുള്ള ദൂരം തുല്യമോ സാധാരണമോ ആണെങ്കിൽ അനുയോജ്യം (തത്തകളിൽ ഒരു ബോവ കൺസ്ട്രക്റ്റർ അളക്കാതിരിക്കാൻ).
കെ-സമീപത്തുള്ള അയൽവാസികളുടെ അൽഗോരിതം അനുമാനിക്കുന്നത് സാധാരണ മൂല്യങ്ങൾ മൾട്ടിഡൈമൻഷണൽ സ്പേസിന്റെ ഒരു പ്രത്യേക മേഖലയിൽ സ്ഥിതി ചെയ്യുന്നു, കൂടാതെ അപാകതകളിലേക്കുള്ള ദൂരം വേർതിരിക്കുന്ന ഹൈപ്പർപ്ലെയിനേക്കാൾ കൂടുതലായിരിക്കും.
5) ക്ലസ്റ്റർ രീതികൾ
ക്ലസ്റ്റർ രീതികളുടെ സാരം, ഒരു മൂല്യം ക്ലസ്റ്റർ കേന്ദ്രങ്ങളിൽ നിന്ന് ഒരു നിശ്ചിത തുകയിൽ കൂടുതൽ അകലെയാണെങ്കിൽ, മൂല്യം അസാധാരണമായി കണക്കാക്കാം എന്നതാണ്.
നിർദ്ദിഷ്ട ടാസ്ക്കിനെ ആശ്രയിച്ചിരിക്കുന്ന ഡാറ്റയെ ശരിയായി ക്ലസ്റ്ററുകൾ ചെയ്യുന്ന ഒരു അൽഗോരിതം ഉപയോഗിക്കുക എന്നതാണ് പ്രധാന കാര്യം.
6) പ്രധാന ഘടകം രീതി
ചിതറിക്കലിലെ ഏറ്റവും വലിയ മാറ്റത്തിന്റെ ദിശകൾ ഹൈലൈറ്റ് ചെയ്യുന്നിടത്ത് അനുയോജ്യം.
7) സമയ ശ്രേണി പ്രവചനത്തെ അടിസ്ഥാനമാക്കിയുള്ള അൽഗോരിതങ്ങൾ
ഒരു മൂല്യം പ്രവചന ആത്മവിശ്വാസ ഇടവേളയ്ക്ക് പുറത്ത് വീഴുകയാണെങ്കിൽ, മൂല്യം അസാധാരണമായി കണക്കാക്കപ്പെടുന്നു എന്നതാണ് ആശയം. ഒരു സമയ ശ്രേണി പ്രവചിക്കാൻ, ട്രിപ്പിൾ സ്മൂത്തിംഗ്, S(ARIMA), ബൂസ്റ്റിംഗ് മുതലായവ പോലുള്ള അൽഗോരിതങ്ങൾ ഉപയോഗിക്കുന്നു.
ടൈം സീരീസ് പ്രവചന അൽഗോരിതങ്ങൾ മുൻ ലേഖനത്തിൽ ചർച്ച ചെയ്തു.
8) മേൽനോട്ടത്തിലുള്ള പഠനം (റിഗ്രഷൻ, വർഗ്ഗീകരണം)
ഡാറ്റ അനുവദിക്കുകയാണെങ്കിൽ, ലീനിയർ റിഗ്രഷൻ മുതൽ ആവർത്തന നെറ്റ്വർക്കുകൾ വരെയുള്ള അൽഗോരിതങ്ങൾ ഞങ്ങൾ ഉപയോഗിക്കുന്നു. പ്രവചനവും യഥാർത്ഥ മൂല്യവും തമ്മിലുള്ള വ്യത്യാസം നമുക്ക് അളക്കാം, കൂടാതെ ഡാറ്റ മാനദണ്ഡത്തിൽ നിന്ന് എത്രത്തോളം വ്യതിചലിക്കുന്നുവെന്ന് ഒരു നിഗമനത്തിലെത്താം. അൽഗോരിതത്തിന് മതിയായ സാമാന്യവൽക്കരണ ശേഷി ഉണ്ടെന്നതും പരിശീലന സെറ്റിൽ അസാധാരണ മൂല്യങ്ങൾ അടങ്ങിയിട്ടില്ലെന്നതും പ്രധാനമാണ്.
9) മോഡൽ ടെസ്റ്റുകൾ
ശുപാർശകൾക്കായി തിരയുന്നതിലെ ഒരു പ്രശ്നമായി അപാകതകൾക്കായി തിരയുന്ന പ്രശ്നത്തെ സമീപിക്കാം. നമുക്ക് SVD അല്ലെങ്കിൽ ഫാക്ടറൈസേഷൻ മെഷീനുകൾ ഉപയോഗിച്ച് ഞങ്ങളുടെ ഫീച്ചർ മാട്രിക്സ് വിഘടിപ്പിക്കാം, കൂടാതെ പുതിയ മാട്രിക്സിലെ മൂല്യങ്ങൾ ഒറിജിനലിൽ നിന്ന് കാര്യമായി വ്യത്യാസപ്പെട്ടിരിക്കുന്നു.
dyakonov.org-ൽ നിന്നുള്ള ചിത്രം
തീരുമാനം
ഈ ലേഖനത്തിൽ, അപാകത കണ്ടെത്തുന്നതിനുള്ള പ്രധാന സമീപനങ്ങൾ ഞങ്ങൾ അവലോകനം ചെയ്തു.
അപാകതകൾ കണ്ടെത്തുന്നതിനെ പല തരത്തിൽ ഒരു കല എന്ന് വിളിക്കാം. അനുയോജ്യമായ അൽഗോരിതം അല്ലെങ്കിൽ സമീപനം ഇല്ല, അതിന്റെ ഉപയോഗം എല്ലാ പ്രശ്നങ്ങളും പരിഹരിക്കുന്നു. ഒരു നിർദ്ദിഷ്ട കേസ് പരിഹരിക്കാൻ പലപ്പോഴും ഒരു കൂട്ടം രീതികൾ ഉപയോഗിക്കുന്നു. വൺ-ക്ലാസ് സപ്പോർട്ട് വെക്റ്റർ മെഷീനുകൾ, വനങ്ങളെ ഒറ്റപ്പെടുത്തൽ, മെട്രിക്, ക്ലസ്റ്റർ രീതികൾ, പ്രധാന ഘടകങ്ങളും സമയ ശ്രേണി പ്രവചനവും ഉപയോഗിച്ചാണ് അപാകത കണ്ടെത്തൽ നടത്തുന്നത്.
നിങ്ങൾക്ക് മറ്റ് രീതികൾ അറിയാമെങ്കിൽ, ലേഖനത്തിലെ അഭിപ്രായങ്ങളിൽ അവയെക്കുറിച്ച് എഴുതുക.
അവലംബം: www.habr.com