В
අයදුම්පත
විෂමතා හඳුනාගැනීම වැනි ක්ෂේත්රවල භාවිතා වේ:
1) උපකරණ බිඳවැටීම් පුරෝකථනය කිරීම
මේ අනුව, 2010 දී, ඉරාන කේන්ද්රාපසාරී Stuxnet වෛරසය මගින් ප්රහාරයට ලක් වූ අතර, එමඟින් උපකරණ ප්රශස්ත නොවන ක්රියාකාරිත්වයට සකසා ඇති අතර වේගවත් ඇඳුම් හේතුවෙන් සමහර උපකරණ අක්රීය කළේය.
උපකරණවල විෂමතා හඳුනාගැනීමේ ඇල්ගොරිතම භාවිතා කළේ නම්, අසාර්ථක තත්ත්වය වළක්වා ගත හැකිය.
උපකරණ ක්රියාත්මක කිරීමේදී විෂමතා සෙවීම න්යෂ්ටික කර්මාන්තයේ පමණක් නොව, ලෝහ විද්යාවේ සහ ගුවන් යානා ටර්බයින ක්රියාත්මක කිරීමේදීද භාවිතා වේ. අනපේක්ෂිත බිඳවැටීමක් හේතුවෙන් සිදුවිය හැකි පාඩු වලට වඩා පුරෝකථන රෝග විනිශ්චය භාවිතා කිරීම ලාභදායී වන වෙනත් ක්ෂේත්රවල.
2) වංචා අනාවැකි
ඔබ ඇල්බේනියාවේ Podolsk හි භාවිතා කරන කාඩ්පතෙන් මුදල් ආපසු ලබා ගන්නේ නම්, ගනුදෙනු තවදුරටත් පරීක්ෂා කිරීමට අවශ්ය විය හැකිය.
3) අසාමාන්ය පාරිභෝගික රටා හඳුනා ගැනීම
සමහර ගනුදෙනුකරුවන් අසාමාන්ය හැසිරීම් ප්රදර්ශනය කරන්නේ නම්, ඔබ නොදන්නා ගැටලුවක් ඇති විය හැක.
4) අසාමාන්ය ඉල්ලුම සහ බර හඳුනා ගැනීම
FMCG වෙළඳසැලක විකුණුම් පුරෝකථනයේ විශ්වාසනීය පරතරයට වඩා පහත වැටී ඇත්නම්, සිදුවන්නේ කුමක්ද යන්න සඳහා හේතුව සොයා ගැනීම වටී.
විෂමතා හඳුනාගැනීමේ ප්රවේශයන්
1) One Class One-Class SVM සහිත දෛශික යන්ත්රය සඳහා සහය වන්න
පුහුණු කට්ටලයේ දත්ත සාමාන්ය ව්යාප්තියක් අනුගමනය කරන විට සුදුසු වේ, නමුත් පරීක්ෂණ කට්ටලයේ විෂමතා අඩංගු වේ.
එක් පන්තියේ ආධාරක දෛශික යන්ත්රය මූලාරම්භය වටා රේඛීය නොවන මතුපිටක් සාදයි. දත්ත විෂම ලෙස සලකනු ලබන කඩඉම් සීමාවක් සැකසිය හැක.
අපගේ DATA4 කණ්ඩායමේ අත්දැකීම් මත පදනම්ව, One-Class SVM යනු විෂමතා සෙවීමේ ගැටලුව විසඳීම සඳහා බහුලව භාවිතා වන ඇල්ගොරිතම වේ.
2) හුදකලා වනාන්තර ක්රමය
ගස් ඉදි කිරීමේ "අහඹු" ක්රමය සමඟ, විමෝචනය මුල් අවධියේදී (ගසෙහි නොගැඹුරු ගැඹුරකදී) කොළ වලට ඇතුල් වනු ඇත, i.e. විමෝචනය "හුදකලා කිරීම" පහසුය. ඇල්ගොරිතමයේ පළමු පුනරාවර්තන වලදී විෂමතා අගයන් හුදකලා වීම සිදු වේ.
3) ඉලිප්සීය ලියුම් කවරය සහ සංඛ්යානමය ක්රම
දත්ත සාමාන්යයෙන් බෙදා හරින විට භාවිතා වේ. මිනුම බෙදාහැරීමේ මිශ්රණයේ වලිගයට සමීප වන තරමට අගය විෂම වේ.
වෙනත් සංඛ්යානමය ක්රම ද මෙම පන්තියට ඇතුළත් කළ හැක.
රූපය dyakonov.org වෙතින්
4) මෙට්රික් ක්රම
ක්රමවලට k-ළඟම අසල්වැසියන්, k-ළඟම අසල්වැසියා, ABOD (කෝණ මත පදනම් වූ පිටත හඳුනාගැනීම) හෝ LOF (දේශීය බාහිර සාධකය) වැනි ඇල්ගොරිතම ඇතුළත් වේ.
ලක්ෂණ වල අගයන් අතර දුර සමාන හෝ සාමාන්යකරණය වී ඇත්නම් (ගිරවුන් තුළ බෝවා කොන්ස්ට්රික්ටරයක් මැනීමට නොහැකි වන පරිදි) සුදුසු වේ.
k-ආසන්නම අසල්වැසි ඇල්ගොරිතම උපකල්පනය කරන්නේ සාමාන්ය අගයන් බහුමාන අවකාශයේ යම් කලාපයක පිහිටා ඇති අතර විෂමතාවන්ට ඇති දුර වෙන් කරන අධි තලයට වඩා වැඩි වනු ඇති බවයි.
5) පොකුරු ක්රම
පොකුරු ක්රමවල සාරය නම් අගයක් පොකුරු මධ්යස්ථානවලින් යම් ප්රමාණයකට වඩා වැඩි නම්, එම අගය විෂම ලෙස සැලකිය හැකිය.
ප්රධාන දෙය වන්නේ නිශ්චිත කාර්යය මත රඳා පවතින දත්ත නිවැරදිව පොකුරු කරන ඇල්ගොරිතමයක් භාවිතා කිරීමයි.
6) ප්රධාන සංරචක ක්රමය
විසරණයේ විශාලතම වෙනසෙහි දිශාවන් උද්දීපනය කර ඇති ස්ථානයට සුදුසුය.
7) කාල ශ්රේණි පුරෝකථනය මත පදනම් වූ ඇල්ගොරිතම
අදහස නම්, යම් අගයක් අනාවැකි විශ්වාස කාල සීමාවෙන් පිටත වැටෙන්නේ නම්, එම අගය විෂම ලෙස සලකනු ලැබේ. කාල ශ්රේණියක් පුරෝකථනය කිරීමට, ත්රිත්ව සුමට කිරීම, S(ARIMA), boosting, වැනි ඇල්ගොරිතම භාවිතා වේ.
කාල ශ්රේණි පුරෝකථනය කිරීමේ ඇල්ගොරිතම පෙර ලිපියෙන් සාකච්ඡා කෙරිණි.
8) අධීක්ෂණ ඉගෙනීම (ප්රතිගමනය, වර්ගීකරණය)
දත්ත ඉඩ දෙන්නේ නම්, අපි රේඛීය ප්රතිගාමීත්වයේ සිට පුනරාවර්තන ජාල දක්වා ඇල්ගොරිතම භාවිතා කරමු. පුරෝකථනය සහ සත්ය අගය අතර වෙනස මැන බලමු, දත්ත සම්මතයෙන් බැහැර වන ප්රමාණයට නිගමනයකට එළඹෙමු. ඇල්ගොරිතමයට ප්රමාණවත් සාමාන්යකරණ හැකියාවක් තිබීම වැදගත් වන අතර පුහුණු කට්ටලයේ විෂමතා අගයන් අඩංගු නොවේ.
9) ආදර්ශ පරීක්ෂණ
විෂමතා සෙවීමේ ගැටලුව නිර්දේශ සෙවීමේ ගැටලුවක් ලෙස ප්රවේශ වෙමු. SVD හෝ සාධකකරණ යන්ත්ර භාවිතයෙන් අපගේ විශේෂාංග අනුකෘතිය වියෝජනය කර, මුල් ඒවාට වඩා සැලකිය යුතු ලෙස වෙනස් වන නව න්යාසයේ ඇති අගයන් විෂම ලෙස ගනිමු.
රූපය dyakonov.org වෙතින්
නිගමනය
මෙම ලිපියෙන් අපි විෂමතා හඳුනාගැනීමේ ප්රධාන ප්රවේශයන් සමාලෝචනය කළෙමු.
විෂමතා සෙවීම බොහෝ ආකාරවලින් කලාවක් ලෙස හැඳින්විය හැක. පරමාදර්ශී ඇල්ගොරිතමයක් හෝ ප්රවේශයක් නොමැත, එය භාවිතා කිරීම සියලු ගැටළු විසඳයි. විශේෂිත නඩුවක් විසඳීම සඳහා බොහෝ විට ක්රම මාලාවක් භාවිතා කරයි. විෂමතා හඳුනාගැනීම එක් පන්තියේ ආධාරක දෛශික යන්ත්ර, වනාන්තර හුදකලා කිරීම, මෙට්රික් සහ පොකුරු ක්රම මෙන්ම ප්රධාන සංරචක සහ කාල ශ්රේණි පුරෝකථනය භාවිතා කරමින් සිදු කෙරේ.
ඔබ වෙනත් ක්රම දන්නේ නම්, ලිපියට අදහස් දැක්වීමේදී ඒවා ගැන ලියන්න.
මූලාශ්රය: www.habr.com