ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

В ಹಿಂದಿನ ಲೇಖನ ನಾವು ಸಮಯ ಸರಣಿಯ ಮುನ್ಸೂಚನೆಯ ಬಗ್ಗೆ ಮಾತನಾಡಿದ್ದೇವೆ. ತಾರ್ಕಿಕ ಮುಂದುವರಿಕೆಯು ವೈಪರೀತ್ಯಗಳನ್ನು ಗುರುತಿಸುವ ಲೇಖನವಾಗಿದೆ.

ಅಪ್ಲಿಕೇಶನ್

ಅಸಂಗತತೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ಅಂತಹ ಪ್ರದೇಶಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ:

1) ಸಲಕರಣೆಗಳ ಸ್ಥಗಿತದ ಮುನ್ಸೂಚನೆ

ಹೀಗಾಗಿ, 2010 ರಲ್ಲಿ, ಇರಾನಿನ ಸೆಂಟ್ರಿಫ್ಯೂಜ್‌ಗಳು ಸ್ಟಕ್ಸ್‌ನೆಟ್ ವೈರಸ್‌ನಿಂದ ದಾಳಿಗೊಳಗಾದವು, ಇದು ಉಪಕರಣಗಳನ್ನು ಸೂಕ್ತವಲ್ಲದ ಕಾರ್ಯಾಚರಣೆಗೆ ಹೊಂದಿಸಿತು ಮತ್ತು ವೇಗವರ್ಧಿತ ಉಡುಗೆಯಿಂದಾಗಿ ಕೆಲವು ಸಾಧನಗಳನ್ನು ನಿಷ್ಕ್ರಿಯಗೊಳಿಸಿತು.

ಉಪಕರಣದಲ್ಲಿ ಅಸಂಗತತೆ ಪತ್ತೆ ಕ್ರಮಾವಳಿಗಳನ್ನು ಬಳಸಿದ್ದರೆ, ವೈಫಲ್ಯದ ಪರಿಸ್ಥಿತಿಯನ್ನು ತಪ್ಪಿಸಬಹುದಿತ್ತು.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

ಉಪಕರಣಗಳ ಕಾರ್ಯಾಚರಣೆಯಲ್ಲಿನ ವೈಪರೀತ್ಯಗಳ ಹುಡುಕಾಟವನ್ನು ಪರಮಾಣು ಉದ್ಯಮದಲ್ಲಿ ಮಾತ್ರವಲ್ಲದೆ ಲೋಹಶಾಸ್ತ್ರ ಮತ್ತು ವಿಮಾನ ಟರ್ಬೈನ್‌ಗಳ ಕಾರ್ಯಾಚರಣೆಯಲ್ಲಿಯೂ ಬಳಸಲಾಗುತ್ತದೆ. ಮತ್ತು ಊಹಿಸಲಾಗದ ಸ್ಥಗಿತದ ಕಾರಣದಿಂದಾಗಿ ಸಂಭವನೀಯ ನಷ್ಟಗಳಿಗಿಂತ ಮುನ್ಸೂಚಕ ರೋಗನಿರ್ಣಯದ ಬಳಕೆಯು ಅಗ್ಗವಾಗಿರುವ ಇತರ ಪ್ರದೇಶಗಳಲ್ಲಿ.

2) ವಂಚನೆಯ ಮುನ್ಸೂಚನೆ

ಅಲ್ಬೇನಿಯಾದ ಪೊಡೊಲ್ಸ್ಕ್‌ನಲ್ಲಿ ನೀವು ಬಳಸುವ ಕಾರ್ಡ್‌ನಿಂದ ಹಣವನ್ನು ಹಿಂಪಡೆದರೆ, ವಹಿವಾಟುಗಳನ್ನು ಮತ್ತಷ್ಟು ಪರಿಶೀಲಿಸಬೇಕಾಗಬಹುದು.

3) ಅಸಹಜ ಗ್ರಾಹಕ ಮಾದರಿಗಳ ಗುರುತಿಸುವಿಕೆ

ಕೆಲವು ಗ್ರಾಹಕರು ಅಸಹಜ ನಡವಳಿಕೆಯನ್ನು ಪ್ರದರ್ಶಿಸಿದರೆ, ನಿಮಗೆ ತಿಳಿದಿಲ್ಲದ ಸಮಸ್ಯೆ ಇರಬಹುದು.

4) ಅಸಹಜ ಬೇಡಿಕೆ ಮತ್ತು ಹೊರೆಯ ಗುರುತಿಸುವಿಕೆ

FMCG ಅಂಗಡಿಯಲ್ಲಿನ ಮಾರಾಟವು ಮುನ್ಸೂಚನೆಯ ವಿಶ್ವಾಸಾರ್ಹ ಮಧ್ಯಂತರಕ್ಕಿಂತ ಕಡಿಮೆಯಿದ್ದರೆ, ಏನಾಗುತ್ತಿದೆ ಎಂಬುದರ ಕಾರಣವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಯೋಗ್ಯವಾಗಿದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಗುರುತಿಸುವ ವಿಧಾನಗಳು

1) ಒನ್ ಕ್ಲಾಸ್ ಒನ್-ಕ್ಲಾಸ್ SVM ನೊಂದಿಗೆ ವೆಕ್ಟರ್ ಯಂತ್ರವನ್ನು ಬೆಂಬಲಿಸಿ

ತರಬೇತಿ ಸೆಟ್‌ನಲ್ಲಿನ ಡೇಟಾವು ಸಾಮಾನ್ಯ ವಿತರಣೆಯನ್ನು ಅನುಸರಿಸಿದಾಗ ಸೂಕ್ತವಾಗಿದೆ, ಆದರೆ ಪರೀಕ್ಷಾ ಸೆಟ್ ವೈಪರೀತ್ಯಗಳನ್ನು ಹೊಂದಿರುತ್ತದೆ.

ಒಂದು-ವರ್ಗದ ಬೆಂಬಲ ವೆಕ್ಟರ್ ಯಂತ್ರವು ಮೂಲದ ಸುತ್ತಲೂ ರೇಖಾತ್ಮಕವಲ್ಲದ ಮೇಲ್ಮೈಯನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ. ಡೇಟಾವನ್ನು ಅಸಂಗತವೆಂದು ಪರಿಗಣಿಸುವ ಕಟ್ಆಫ್ ಮಿತಿಯನ್ನು ಹೊಂದಿಸಲು ಸಾಧ್ಯವಿದೆ.

ನಮ್ಮ DATA4 ತಂಡದ ಅನುಭವದ ಆಧಾರದ ಮೇಲೆ, ವೈಪರೀತ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಒನ್-ಕ್ಲಾಸ್ SVM ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಅಲ್ಗಾರಿದಮ್ ಆಗಿದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

2) ಪ್ರತ್ಯೇಕ ಅರಣ್ಯ ವಿಧಾನ

ಮರಗಳನ್ನು ನಿರ್ಮಿಸುವ "ಯಾದೃಚ್ಛಿಕ" ವಿಧಾನದೊಂದಿಗೆ, ಹೊರಸೂಸುವಿಕೆಯು ಆರಂಭಿಕ ಹಂತಗಳಲ್ಲಿ ಎಲೆಗಳನ್ನು ಪ್ರವೇಶಿಸುತ್ತದೆ (ಮರದ ಆಳವಿಲ್ಲದ ಆಳದಲ್ಲಿ), ಅಂದರೆ. ಹೊರಸೂಸುವಿಕೆಯು "ಪ್ರತ್ಯೇಕಿಸಲು" ಸುಲಭವಾಗಿದೆ. ಅಸಂಗತ ಮೌಲ್ಯಗಳ ಪ್ರತ್ಯೇಕತೆಯು ಅಲ್ಗಾರಿದಮ್‌ನ ಮೊದಲ ಪುನರಾವರ್ತನೆಗಳಲ್ಲಿ ಸಂಭವಿಸುತ್ತದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

3) ಎಲಿಪ್ಟಿಕ್ ಹೊದಿಕೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳು

ಡೇಟಾವನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ವಿತರಿಸಿದಾಗ ಬಳಸಲಾಗುತ್ತದೆ. ಮಾಪನವು ವಿತರಣೆಗಳ ಮಿಶ್ರಣದ ಬಾಲಕ್ಕೆ ಹತ್ತಿರದಲ್ಲಿದೆ, ಮೌಲ್ಯವು ಹೆಚ್ಚು ಅಸಂಗತವಾಗಿರುತ್ತದೆ.

ಈ ವರ್ಗದಲ್ಲಿ ಇತರ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಧಾನಗಳನ್ನು ಸಹ ಸೇರಿಸಬಹುದು.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು
dyakonov.org ನಿಂದ ಚಿತ್ರ

4) ಮೆಟ್ರಿಕ್ ವಿಧಾನಗಳು

ವಿಧಾನಗಳು k-ಸಮೀಪದ ನೆರೆಹೊರೆಯವರು, k-ಹತ್ತಿರದ ನೆರೆಹೊರೆಯವರು, ABOD (ಕೋನ-ಆಧಾರಿತ ಹೊರಗಿನ ಪತ್ತೆ) ಅಥವಾ LOF (ಸ್ಥಳೀಯ ಹೊರಗಿನ ಅಂಶ) ನಂತಹ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿವೆ.

ಗುಣಲಕ್ಷಣಗಳಲ್ಲಿನ ಮೌಲ್ಯಗಳ ನಡುವಿನ ಅಂತರವು ಸಮಾನವಾಗಿದ್ದರೆ ಅಥವಾ ಸಾಮಾನ್ಯವಾಗಿದ್ದರೆ (ಗಿಳಿಗಳಲ್ಲಿ ಬೋವಾ ಸಂಕೋಚಕವನ್ನು ಅಳೆಯದಂತೆ) ಸೂಕ್ತವಾಗಿದೆ.

k-ಹತ್ತಿರದ ನೆರೆಹೊರೆಯವರ ಅಲ್ಗಾರಿದಮ್ ಸಾಮಾನ್ಯ ಮೌಲ್ಯಗಳು ಬಹುಆಯಾಮದ ಜಾಗದ ಒಂದು ನಿರ್ದಿಷ್ಟ ಪ್ರದೇಶದಲ್ಲಿ ನೆಲೆಗೊಂಡಿವೆ ಮತ್ತು ವೈಪರೀತ್ಯಗಳ ಅಂತರವು ಬೇರ್ಪಡಿಸುವ ಹೈಪರ್‌ಪ್ಲೇನ್‌ಗಿಂತ ಹೆಚ್ಚಾಗಿರುತ್ತದೆ ಎಂದು ಊಹಿಸುತ್ತದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

5) ಕ್ಲಸ್ಟರ್ ವಿಧಾನಗಳು

ಕ್ಲಸ್ಟರ್ ವಿಧಾನಗಳ ಮೂಲಭೂತವಾಗಿ ಒಂದು ಮೌಲ್ಯವು ಕ್ಲಸ್ಟರ್ ಕೇಂದ್ರಗಳಿಂದ ನಿರ್ದಿಷ್ಟ ಮೊತ್ತಕ್ಕಿಂತ ಹೆಚ್ಚು ದೂರದಲ್ಲಿದ್ದರೆ, ಮೌಲ್ಯವನ್ನು ಅಸಂಗತವೆಂದು ಪರಿಗಣಿಸಬಹುದು.

ನಿರ್ದಿಷ್ಟ ಕಾರ್ಯವನ್ನು ಅವಲಂಬಿಸಿ ಡೇಟಾವನ್ನು ಸರಿಯಾಗಿ ಕ್ಲಸ್ಟರ್ ಮಾಡುವ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಬಳಸುವುದು ಮುಖ್ಯ ವಿಷಯವಾಗಿದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

6) ಪ್ರಧಾನ ಘಟಕ ವಿಧಾನ

ಪ್ರಸರಣದಲ್ಲಿನ ದೊಡ್ಡ ಬದಲಾವಣೆಯ ದಿಕ್ಕುಗಳನ್ನು ಹೈಲೈಟ್ ಮಾಡುವಲ್ಲಿ ಸೂಕ್ತವಾಗಿದೆ.

7) ಸಮಯ ಸರಣಿಯ ಮುನ್ಸೂಚನೆಯ ಆಧಾರದ ಮೇಲೆ ಅಲ್ಗಾರಿದಮ್‌ಗಳು

ಒಂದು ಮೌಲ್ಯವು ಭವಿಷ್ಯ ವಿಶ್ವಾಸಾರ್ಹ ಮಧ್ಯಂತರದಿಂದ ಹೊರಗೆ ಬಿದ್ದರೆ, ಮೌಲ್ಯವನ್ನು ಅಸಂಗತವೆಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ. ಸಮಯದ ಸರಣಿಯನ್ನು ಊಹಿಸಲು, ಟ್ರಿಪಲ್ ಸರಾಗವಾಗುವಿಕೆ, S(ARIMA), ಬೂಸ್ಟಿಂಗ್, ಇತ್ಯಾದಿ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.

ಹಿಂದಿನ ಲೇಖನದಲ್ಲಿ ಸಮಯ ಸರಣಿಯ ಮುನ್ಸೂಚನೆಯ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಚರ್ಚಿಸಲಾಗಿದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

8) ಮೇಲ್ವಿಚಾರಣೆಯ ಕಲಿಕೆ (ಹಿಮ್ಮೆಟ್ಟುವಿಕೆ, ವರ್ಗೀಕರಣ)

ಡೇಟಾ ಅನುಮತಿಸಿದರೆ, ನಾವು ರೇಖೀಯ ಹಿಂಜರಿತದಿಂದ ಮರುಕಳಿಸುವ ನೆಟ್‌ವರ್ಕ್‌ಗಳವರೆಗಿನ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಬಳಸುತ್ತೇವೆ. ಭವಿಷ್ಯ ಮತ್ತು ನಿಜವಾದ ಮೌಲ್ಯದ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಅಳೆಯೋಣ ಮತ್ತು ಡೇಟಾವು ರೂಢಿಯಿಂದ ಎಷ್ಟು ವಿಚಲನಗೊಳ್ಳುತ್ತದೆ ಎಂಬುದರ ಬಗ್ಗೆ ತೀರ್ಮಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳೋಣ. ಅಲ್ಗಾರಿದಮ್ ಸಾಕಷ್ಟು ಸಾಮಾನ್ಯೀಕರಣ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ ಮತ್ತು ತರಬೇತಿ ಸೆಟ್ ಅಸಂಗತ ಮೌಲ್ಯಗಳನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ ಎಂಬುದು ಮುಖ್ಯ.

9) ಮಾದರಿ ಪರೀಕ್ಷೆಗಳು

ಶಿಫಾರಸುಗಳನ್ನು ಹುಡುಕುವ ಸಮಸ್ಯೆಯಾಗಿ ವೈಪರೀತ್ಯಗಳನ್ನು ಹುಡುಕುವ ಸಮಸ್ಯೆಯನ್ನು ಸಮೀಪಿಸೋಣ. SVD ಅಥವಾ ಫ್ಯಾಕ್ಟರೈಸೇಶನ್ ಯಂತ್ರಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಮ್ಮ ವೈಶಿಷ್ಟ್ಯದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ವಿಘಟಿಸೋಣ ಮತ್ತು ಹೊಸ ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ನಲ್ಲಿನ ಮೌಲ್ಯಗಳನ್ನು ಅಸಮಂಜಸವಾಗಿ ಮೂಲದಿಂದ ಗಮನಾರ್ಹವಾಗಿ ಭಿನ್ನವಾಗಿದೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು 9 ವಿಧಾನಗಳು

dyakonov.org ನಿಂದ ಚಿತ್ರ

ತೀರ್ಮಾನಕ್ಕೆ

ಈ ಲೇಖನದಲ್ಲಿ, ಅಸಂಗತತೆಯನ್ನು ಪತ್ತೆಹಚ್ಚಲು ನಾವು ಮುಖ್ಯ ವಿಧಾನಗಳನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೇವೆ.

ವೈಪರೀತ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವುದನ್ನು ಅನೇಕ ವಿಧಗಳಲ್ಲಿ ಕಲೆ ಎಂದು ಕರೆಯಬಹುದು. ಯಾವುದೇ ಆದರ್ಶ ಅಲ್ಗಾರಿದಮ್ ಅಥವಾ ವಿಧಾನವಿಲ್ಲ, ಅದರ ಬಳಕೆಯು ಎಲ್ಲಾ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುತ್ತದೆ. ನಿರ್ದಿಷ್ಟ ಪ್ರಕರಣವನ್ನು ಪರಿಹರಿಸಲು ಹೆಚ್ಚಾಗಿ ವಿಧಾನಗಳ ಗುಂಪನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಅಸಂಗತತೆಯ ಪತ್ತೆಯನ್ನು ಏಕ-ವರ್ಗದ ಬೆಂಬಲ ವೆಕ್ಟರ್ ಯಂತ್ರಗಳು, ಕಾಡುಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸುವುದು, ಮೆಟ್ರಿಕ್ ಮತ್ತು ಕ್ಲಸ್ಟರ್ ವಿಧಾನಗಳು, ಹಾಗೆಯೇ ಪ್ರಮುಖ ಘಟಕಗಳು ಮತ್ತು ಸಮಯ ಸರಣಿಯ ಮುನ್ಸೂಚನೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಕೈಗೊಳ್ಳಲಾಗುತ್ತದೆ.

ನಿಮಗೆ ಇತರ ವಿಧಾನಗಳು ತಿಳಿದಿದ್ದರೆ, ಲೇಖನಕ್ಕೆ ಕಾಮೆಂಟ್ಗಳಲ್ಲಿ ಅವುಗಳ ಬಗ್ಗೆ ಬರೆಯಿರಿ.

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ