ಡೇಟಾ ಸೈನ್ಸ್ ಚಾರ್ಲಾಟನ್ ಅನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?

ಡೇಟಾ ಸೈನ್ಸ್ ಚಾರ್ಲಾಟನ್ ಅನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?
ನೀವು ವಿಶ್ಲೇಷಕರು, ಯಂತ್ರ ಕಲಿಕೆ ಮತ್ತು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ತಜ್ಞರ ಬಗ್ಗೆ ಕೇಳಿರಬಹುದು, ಆದರೆ ಅನ್ಯಾಯವಾಗಿ ಹೆಚ್ಚು ಸಂಬಳ ಪಡೆಯುವವರ ಬಗ್ಗೆ ನೀವು ಕೇಳಿದ್ದೀರಾ? ಭೇಟಿ ಮಾಡಿ ಡೇಟಾ ಚಾರ್ಲಾಟನ್! ಲಾಭದಾಯಕ ಉದ್ಯೋಗಗಳಿಂದ ಆಮಿಷಕ್ಕೆ ಒಳಗಾಗುವ ಈ ಹ್ಯಾಕ್‌ಗಳು ನೈಜ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಿಗೆ ಕೆಟ್ಟ ಹೆಸರನ್ನು ನೀಡುತ್ತವೆ. ಅಂತಹ ಜನರನ್ನು ಶುದ್ಧ ನೀರಿಗೆ ಹೇಗೆ ತರಬೇಕು ಎಂದು ವಸ್ತುವಿನಲ್ಲಿ ನಾವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತೇವೆ.

ಡೇಟಾ ಚಾರ್ಲಾಟನ್ಸ್ ಎಲ್ಲೆಡೆ ಇವೆ

ಡೇಟಾ ಚಾರ್ಲಾಟನ್‌ಗಳು ಸರಳ ದೃಷ್ಟಿಯಲ್ಲಿ ಮರೆಮಾಡಲು ತುಂಬಾ ಒಳ್ಳೆಯದು, ನೀವು ಮಾಡಬಹುದು ಅವರಲ್ಲಿ ಒಬ್ಬರಾಗಿರಿಅರಿವಿಲ್ಲದೆ. ಸಾಧ್ಯತೆಗಳೆಂದರೆ, ನಿಮ್ಮ ಸಂಸ್ಥೆಯು ಈ ಸ್ನೀಕಿ ಹುಡುಗರನ್ನು ವರ್ಷಗಳಿಂದ ಆಶ್ರಯಿಸುತ್ತಿದೆ, ಆದರೆ ಒಳ್ಳೆಯ ಸುದ್ದಿ ಏನೆಂದರೆ, ಏನನ್ನು ನೋಡಬೇಕೆಂದು ನಿಮಗೆ ತಿಳಿದಿದ್ದರೆ ಅವರು ಗುರುತಿಸುವುದು ಸುಲಭ.
ಮೊದಲ ಎಚ್ಚರಿಕೆಯ ಸಂಕೇತವೆಂದರೆ ಅದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳದಿರುವುದು ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಅಂಕಿಅಂಶಗಳು ವಿಭಿನ್ನ ವಿಭಾಗಗಳಾಗಿವೆ. ನಾನು ಇದನ್ನು ಮುಂದೆ ವಿವರಿಸುತ್ತೇನೆ.

ವಿವಿಧ ಶಿಸ್ತುಗಳು

ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ತಮ್ಮ ಡೇಟಾವನ್ನು ಮೀರಿದ ಬಗ್ಗೆ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ತರಬೇತಿ ನೀಡುತ್ತಾರೆ, ವಿಶ್ಲೇಷಕರು ಡೇಟಾ ಸೆಟ್‌ನ ವಿಷಯವನ್ನು ಪರೀಕ್ಷಿಸಲು ತರಬೇತಿ ನೀಡುತ್ತಾರೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ವಿಶ್ಲೇಷಕರು ತಮ್ಮ ಡೇಟಾದಲ್ಲಿ ಏನಿದೆ ಎಂಬುದರ ಕುರಿತು ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ಡೇಟಾದಲ್ಲಿ ಏನಿಲ್ಲ ಎಂಬುದರ ಕುರಿತು ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ. ವಿಶ್ಲೇಷಕರು ನಿಮಗೆ ಒಳ್ಳೆಯ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳಲು ಸಹಾಯ ಮಾಡುತ್ತಾರೆ (ಊಹೆಗಳನ್ನು ಮಾಡಿ), ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ನಿಮಗೆ ಉತ್ತಮ ಉತ್ತರಗಳನ್ನು ಪಡೆಯಲು ಸಹಾಯ ಮಾಡುತ್ತಾರೆ (ನಿಮ್ಮ ಊಹೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಿ).

ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಎರಡು ಕುರ್ಚಿಗಳ ಮೇಲೆ ಕುಳಿತುಕೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸುವ ವಿಚಿತ್ರವಾದ ಹೈಬ್ರಿಡ್ ಪಾತ್ರಗಳೂ ಇವೆ ... ಏಕೆ? ಡೇಟಾ ವಿಜ್ಞಾನದ ಮೂಲ ತತ್ವ: ನೀವು ಅನಿಶ್ಚಿತತೆಯೊಂದಿಗೆ ವ್ಯವಹರಿಸುತ್ತಿದ್ದರೆ, ನೀವು ಬಳಸಲಾಗುವುದಿಲ್ಲ ಅದೇ ಊಹೆಗಳು ಮತ್ತು ಪರೀಕ್ಷೆಗಾಗಿ ಡೇಟಾ ಪಾಯಿಂಟ್. ಡೇಟಾ ಸೀಮಿತವಾದಾಗ, ಅನಿಶ್ಚಿತತೆಯು ಅಂಕಿಅಂಶಗಳು ಅಥವಾ ವಿಶ್ಲೇಷಣೆಗಳ ನಡುವೆ ಆಯ್ಕೆಯನ್ನು ಒತ್ತಾಯಿಸುತ್ತದೆ. ವಿವರಣೆ ಇಲ್ಲಿ.

ಅಂಕಿಅಂಶಗಳಿಲ್ಲದೆ, ನೀವು ಅಂಟಿಕೊಂಡಿರುವಿರಿ ಮತ್ತು ನೀವು ಈಗ ರೂಪಿಸಿದ ತೀರ್ಪು ಹಿಡಿದಿಟ್ಟುಕೊಳ್ಳುತ್ತದೆಯೇ ಎಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಯಿಲ್ಲದೆ, ನೀವು ಅಜ್ಞಾತವನ್ನು ಪಳಗಿಸುವ ಕಡಿಮೆ ಅವಕಾಶದೊಂದಿಗೆ ಕುರುಡಾಗಿ ಚಲಿಸುತ್ತಿದ್ದೀರಿ. ಇದು ಕಷ್ಟಕರವಾದ ಆಯ್ಕೆಯಾಗಿದೆ.

ಈ ಅವ್ಯವಸ್ಥೆಯಿಂದ ಹೊರಬರುವ ಮಾರ್ಗವೆಂದರೆ ಅದನ್ನು ನಿರ್ಲಕ್ಷಿಸುವುದು ಮತ್ತು ನಂತರ ಇದ್ದಕ್ಕಿದ್ದಂತೆ ಏನಾಗುತ್ತದೆ ಎಂದು ಆಶ್ಚರ್ಯಪಡುವಂತೆ ನಟಿಸುವುದು. ಅಂಕಿಅಂಶಗಳ ಊಹೆಗಳನ್ನು ಪರೀಕ್ಷಿಸುವ ಹಿಂದಿನ ತರ್ಕವು ನಮ್ಮ ಮನಸ್ಸನ್ನು ಬದಲಾಯಿಸುವಷ್ಟು ಡೇಟಾವು ನಮಗೆ ಆಶ್ಚರ್ಯವನ್ನು ನೀಡುತ್ತದೆಯೇ ಎಂಬ ಪ್ರಶ್ನೆಗೆ ಬರುತ್ತದೆ. ನಾವು ಈಗಾಗಲೇ ಡೇಟಾವನ್ನು ನೋಡಿದ್ದರೆ ನಾವು ಅದನ್ನು ಹೇಗೆ ಆಶ್ಚರ್ಯಗೊಳಿಸಬಹುದು?

ಚಾರ್ಲಾಟನ್ನರು ಮಾದರಿಯನ್ನು ಕಂಡುಕೊಂಡಾಗ, ಅವರು ಸ್ಫೂರ್ತಿ ಪಡೆಯುತ್ತಾರೆ, ನಂತರ ಪರಿಶೀಲಿಸಿ ಅದೇ ಡೇಟಾ ಗೆ ಅದೇ ಮಾದರಿ, ಅವರ ಸಿದ್ಧಾಂತದ ಪಕ್ಕದಲ್ಲಿ ಕಾನೂನುಬದ್ಧ p-ಮೌಲ್ಯ ಅಥವಾ ಎರಡರೊಂದಿಗೆ ಫಲಿತಾಂಶವನ್ನು ಪ್ರಕಟಿಸಲು. ಹೀಗಾಗಿ, ಅವರು ನಿಮಗೆ ಸುಳ್ಳು ಹೇಳುತ್ತಿದ್ದಾರೆ (ಮತ್ತು, ಬಹುಶಃ, ತಮಗೂ ಸಹ). ನಿಮ್ಮ ಊಹೆಗೆ ನೀವು ಅಂಟಿಕೊಳ್ಳದಿದ್ದರೆ ಈ p-ಮೌಲ್ಯವು ಅಪ್ರಸ್ತುತವಾಗುತ್ತದೆ ಗೆ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೀವು ಹೇಗೆ ವೀಕ್ಷಿಸಿದ್ದೀರಿ. ಚಾರ್ಲಾಟನ್ನರು ಕಾರಣಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳದೆ ವಿಶ್ಲೇಷಕರು ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರ ಕ್ರಮಗಳನ್ನು ಅನುಕರಿಸುತ್ತಾರೆ. ಪರಿಣಾಮವಾಗಿ, ಡೇಟಾ ವಿಜ್ಞಾನದ ಸಂಪೂರ್ಣ ಕ್ಷೇತ್ರವು ಕೆಟ್ಟ ಖ್ಯಾತಿಯನ್ನು ಪಡೆಯುತ್ತದೆ.

ನಿಜವಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ಯಾವಾಗಲೂ ತಮ್ಮದೇ ಆದ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ

ಅವರ ಕಠಿಣ ತಾರ್ಕಿಕತೆಗಾಗಿ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರ ಬಹುತೇಕ ಅತೀಂದ್ರಿಯ ಖ್ಯಾತಿಗೆ ಧನ್ಯವಾದಗಳು, ಡೇಟಾ ಸೈನ್ಸ್‌ನಲ್ಲಿನ ನಕಲಿ ಮಾಹಿತಿಯ ಪ್ರಮಾಣವು ಸಾರ್ವಕಾಲಿಕ ಎತ್ತರದಲ್ಲಿದೆ. ಮೋಸ ಮಾಡುವುದು ಸುಲಭ ಮತ್ತು ಸಿಕ್ಕಿಹಾಕಿಕೊಳ್ಳದಿರುವುದು, ವಿಶೇಷವಾಗಿ ಅನುಮಾನಾಸ್ಪದ ಬಲಿಪಶು ಇದು ಸಮೀಕರಣಗಳು ಮತ್ತು ಡೇಟಾದ ಬಗ್ಗೆ ಯೋಚಿಸಿದರೆ. ಡೇಟಾಸೆಟ್ ಒಂದು ಡೇಟಾಸೆಟ್ ಆಗಿದೆ, ಸರಿ? ಸಂ. ನೀವು ಅದನ್ನು ಹೇಗೆ ಬಳಸುತ್ತೀರಿ ಎಂಬುದು ಮುಖ್ಯವಾಗಿದೆ.

ಅದೃಷ್ಟವಶಾತ್, ಚಾರ್ಲಾಟನ್‌ಗಳನ್ನು ಹಿಡಿಯಲು ನಿಮಗೆ ಒಂದು ಸುಳಿವು ಮಾತ್ರ ಬೇಕಾಗುತ್ತದೆ: ಅವರು "ಹಿಂದೆಯೇ ಅಮೆರಿಕವನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತಿದ್ದಾರೆ." ಡೇಟಾದಲ್ಲಿ ಈಗಾಗಲೇ ತಿಳಿದಿರುವ ವಿದ್ಯಮಾನಗಳನ್ನು ಮರುಶೋಧಿಸುವ ಮೂಲಕ.

ಚಾರ್ಲಾಟನ್ನರಂತಲ್ಲದೆ, ಉತ್ತಮ ವಿಶ್ಲೇಷಕರು ಮುಕ್ತ ಮನಸ್ಸಿನವರು ಮತ್ತು ಸ್ಪೂರ್ತಿದಾಯಕ ವಿಚಾರಗಳು ಹಲವು ವಿಭಿನ್ನ ವಿವರಣೆಗಳನ್ನು ಹೊಂದಿರಬಹುದು ಎಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತಾರೆ. ಅದೇ ಸಮಯದಲ್ಲಿ, ಉತ್ತಮ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ತಮ್ಮ ತೀರ್ಮಾನಗಳನ್ನು ಮಾಡುವ ಮೊದಲು ಎಚ್ಚರಿಕೆಯಿಂದ ವ್ಯಾಖ್ಯಾನಿಸುತ್ತಾರೆ.

ವಿಶ್ಲೇಷಕರು ಹೊಣೆಗಾರಿಕೆಯಿಂದ ವಿನಾಯಿತಿ ಪಡೆದಿರುತ್ತಾರೆ... ಅವರು ತಮ್ಮ ಡೇಟಾದ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ ಉಳಿಯುವವರೆಗೆ. ಅವರು ನೋಡದಿದ್ದನ್ನು ಹೇಳಿಕೊಳ್ಳಲು ಅವರು ಪ್ರಚೋದಿಸಿದರೆ, ಅದು ಸಂಪೂರ್ಣವಾಗಿ ಬೇರೆ ಕೆಲಸ. ಅವರು ವಿಶ್ಲೇಷಕರ ಬೂಟುಗಳನ್ನು ತೆಗೆದು ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರ ಬೂಟುಗಳನ್ನು ಹಾಕಬೇಕು. ಎಲ್ಲಾ ನಂತರ, ಅಧಿಕೃತ ಉದ್ಯೋಗ ಶೀರ್ಷಿಕೆ ಏನೇ ಇರಲಿ, ನೀವು ಬಯಸಿದರೆ ನೀವು ಎರಡೂ ವೃತ್ತಿಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಬಾರದು ಎಂದು ಯಾವುದೇ ನಿಯಮವಿಲ್ಲ. ಸುಮ್ಮನೆ ಅವರನ್ನು ಗೊಂದಲಗೊಳಿಸಬೇಡಿ.

ನೀವು ಅಂಕಿಅಂಶಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿರುವುದರಿಂದ ನೀವು ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ ಉತ್ತಮರು ಎಂದು ಅರ್ಥವಲ್ಲ ಮತ್ತು ಪ್ರತಿಯಾಗಿ. ಯಾರಾದರೂ ನಿಮಗೆ ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳಲು ಪ್ರಯತ್ನಿಸಿದರೆ, ನೀವು ಜಾಗರೂಕರಾಗಿರಬೇಕು. ನೀವು ಈಗಾಗಲೇ ಅಧ್ಯಯನ ಮಾಡಿದ ಡೇಟಾದಿಂದ ಅಂಕಿಅಂಶಗಳ ತೀರ್ಮಾನಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಅನುಮತಿ ಇದೆ ಎಂದು ಈ ವ್ಯಕ್ತಿಯು ನಿಮಗೆ ಹೇಳಿದರೆ, ಇದು ದುಪ್ಪಟ್ಟು ಜಾಗರೂಕರಾಗಿರಲು ಒಂದು ಕಾರಣವಾಗಿದೆ.

ವಿಲಕ್ಷಣ ವಿವರಣೆಗಳು

ಕಾಡಿನಲ್ಲಿ ಡೇಟಾ ಚಾರ್ಲಾಟನ್‌ಗಳನ್ನು ಗಮನಿಸಿದಾಗ, ಅವರು ಗಮನಿಸಿದ ಡೇಟಾವನ್ನು "ವಿವರಿಸಲು" ಅವರು ಅದ್ಭುತ ಕಥೆಗಳನ್ನು ಮಾಡಲು ಇಷ್ಟಪಡುತ್ತಾರೆ ಎಂದು ನೀವು ಗಮನಿಸಬಹುದು. ಹೆಚ್ಚು ಶೈಕ್ಷಣಿಕ, ಉತ್ತಮ. ಈ ಕಥೆಗಳು ಹಿನ್ನೋಟದಲ್ಲಿ ಹೊಂದಿಕೊಂಡಿದ್ದರೂ ಪರವಾಗಿಲ್ಲ.

ಚಾರ್ಲಾಟನ್ಸ್ ಇದನ್ನು ಮಾಡಿದಾಗ - ನಾನು ಸ್ಪಷ್ಟವಾಗಿ ಹೇಳುತ್ತೇನೆ - ಅವರು ಸುಳ್ಳು ಮಾಡುತ್ತಿದ್ದಾರೆ. ಯಾವುದೇ ಸಮೀಕರಣಗಳು ಅಥವಾ ಅಲಂಕಾರಿಕ ಪರಿಕಲ್ಪನೆಗಳು ಅವರು ತಮ್ಮ ಸಿದ್ಧಾಂತಗಳಿಗೆ ಶೂನ್ಯ ಪುರಾವೆಯನ್ನು ನೀಡುತ್ತವೆ ಎಂಬ ಅಂಶವನ್ನು ಸರಿದೂಗಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಅವರ ವಿವರಣೆಗಳು ಎಷ್ಟು ಅಸಾಮಾನ್ಯವಾಗಿವೆ ಎಂದು ಆಶ್ಚರ್ಯಪಡಬೇಡಿ.

ನಿಮ್ಮ ಕೈಯಲ್ಲಿರುವ ಕಾರ್ಡ್‌ಗಳನ್ನು ಮೊದಲು ನೋಡುವ ಮೂಲಕ ನಿಮ್ಮ "ಅತೀಂದ್ರಿಯ" ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಪ್ರದರ್ಶಿಸಲು ಇದು ಒಂದೇ ಆಗಿರುತ್ತದೆ ಮತ್ತು ನಂತರ ನೀವು ಏನನ್ನು ಹಿಡಿದಿರುವಿರಿ ... ನೀವು ಏನನ್ನು ಹಿಡಿದಿದ್ದೀರಿ ಎಂದು ಊಹಿಸಿ. ಇದು ಹಿಂದಿನ ಪಕ್ಷಪಾತವಾಗಿದೆ ಮತ್ತು ಡೇಟಾ ಸೈನ್ಸ್ ವೃತ್ತಿಯು ಅದರೊಂದಿಗೆ ಅಂಚಿನಲ್ಲಿ ತುಂಬಿದೆ.

ಡೇಟಾ ಸೈನ್ಸ್ ಚಾರ್ಲಾಟನ್ ಅನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?

ವಿಶ್ಲೇಷಕರು ಹೇಳುತ್ತಾರೆ: "ನೀವು ವಜ್ರಗಳ ರಾಣಿಯೊಂದಿಗೆ ಹೋಗಿದ್ದೀರಿ." ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರು ಹೇಳುತ್ತಾರೆ, “ನಾವು ಪ್ರಾರಂಭಿಸುವ ಮೊದಲು ನಾನು ಈ ಕಾಗದದ ಮೇಲೆ ನನ್ನ ಕಲ್ಪನೆಗಳನ್ನು ಬರೆದಿದ್ದೇನೆ. ನಾವು ಸುತ್ತಲೂ ಆಡೋಣ, ಕೆಲವು ಡೇಟಾವನ್ನು ನೋಡೋಣ ಮತ್ತು ನಾನು ಸರಿಯೇ ಎಂದು ನೋಡೋಣ." ಚಾರ್ಲಾಟನ್ಸ್ ಹೇಳುತ್ತಾರೆ: "ನೀವು ಈ ವಜ್ರಗಳ ರಾಣಿಯಾಗುತ್ತೀರಿ ಎಂದು ನನಗೆ ತಿಳಿದಿತ್ತು ಏಕೆಂದರೆ..."

ಡೇಟಾ ಹಂಚಿಕೆ ಎಲ್ಲರಿಗೂ ಅಗತ್ಯವಿರುವ ತ್ವರಿತ ಪರಿಹಾರವಾಗಿದೆ.

ಹೆಚ್ಚಿನ ಡೇಟಾ ಇಲ್ಲದಿದ್ದಾಗ, ನೀವು ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗಳ ನಡುವೆ ಆಯ್ಕೆ ಮಾಡಬೇಕಾಗುತ್ತದೆ, ಆದರೆ ಸಾಕಷ್ಟು ಡೇಟಾ ಹೆಚ್ಚು ಇದ್ದಾಗ, ವಂಚನೆ ಇಲ್ಲದೆ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಬಳಸಲು ಉತ್ತಮ ಅವಕಾಶವಿದೆ и ಅಂಕಿಅಂಶಗಳು. ನೀವು ಚಾರ್ಲಾಟನ್‌ಗಳ ವಿರುದ್ಧ ಪರಿಪೂರ್ಣ ರಕ್ಷಣೆಯನ್ನು ಹೊಂದಿದ್ದೀರಿ - ಡೇಟಾ ಬೇರ್ಪಡಿಕೆ ಮತ್ತು, ನನ್ನ ಅಭಿಪ್ರಾಯದಲ್ಲಿ, ಇದು ಡೇಟಾ ಸೈನ್ಸ್‌ನಲ್ಲಿ ಅತ್ಯಂತ ಶಕ್ತಿಶಾಲಿ ಕಲ್ಪನೆಯಾಗಿದೆ.

ಚಾರ್ಲಾಟನ್‌ಗಳಿಂದ ನಿಮ್ಮನ್ನು ರಕ್ಷಿಸಿಕೊಳ್ಳಲು, ನೀವು ಮಾಡಬೇಕಾಗಿರುವುದು ಕೆಲವು ಪರೀಕ್ಷಾ ಡೇಟಾವನ್ನು ಅವರ ಗೂಢಾಚಾರಿಕೆಯ ಕಣ್ಣುಗಳಿಗೆ ತಲುಪದಂತೆ ನೀವು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ ಮತ್ತು ನಂತರ ಉಳಿದವುಗಳನ್ನು ವಿಶ್ಲೇಷಣೆಯಾಗಿ ಪರಿಗಣಿಸಿ. ನೀವು ಒಪ್ಪಿಕೊಳ್ಳುವ ಅಪಾಯದಲ್ಲಿರುವ ಸಿದ್ಧಾಂತವನ್ನು ನೀವು ನೋಡಿದಾಗ, ಪರಿಸ್ಥಿತಿಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಅದನ್ನು ಬಳಸಿ, ತದನಂತರ ಸಿದ್ಧಾಂತವು ಅಸಂಬದ್ಧವಲ್ಲ ಎಂದು ಪರಿಶೀಲಿಸಲು ನಿಮ್ಮ ರಹಸ್ಯ ಪರೀಕ್ಷಾ ಡೇಟಾವನ್ನು ಬಹಿರಂಗಪಡಿಸಿ. ಇದು ತುಂಬಾ ಸರಳವಾಗಿದೆ!

ಡೇಟಾ ಸೈನ್ಸ್ ಚಾರ್ಲಾಟನ್ ಅನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?
ಪರಿಶೋಧನೆಯ ಹಂತದಲ್ಲಿ ಪರೀಕ್ಷಾ ಡೇಟಾವನ್ನು ವೀಕ್ಷಿಸಲು ಯಾರಿಗೂ ಅನುಮತಿಯಿಲ್ಲ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ. ಇದನ್ನು ಮಾಡಲು, ಸಂಶೋಧನಾ ಡೇಟಾಗೆ ಅಂಟಿಕೊಳ್ಳಿ. ಪರೀಕ್ಷೆಯ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಣೆಗೆ ಬಳಸಬಾರದು.

"ಸಣ್ಣ ಡೇಟಾ" ಯುಗದಲ್ಲಿ ಜನರು ಬಳಸಿದ್ದಕ್ಕಿಂತ ಇದು ಒಂದು ದೊಡ್ಡ ಹೆಜ್ಜೆಯಾಗಿದೆ, ಅಲ್ಲಿ ನೀವು ನಿಜವಾಗಿಯೂ ಏನನ್ನಾದರೂ ತಿಳಿದಿದ್ದೀರಿ ಎಂದು ಅಂತಿಮವಾಗಿ ಜನರಿಗೆ ಮನವರಿಕೆ ಮಾಡಲು ನಿಮಗೆ ತಿಳಿದಿರುವುದನ್ನು ನೀವು ಹೇಗೆ ತಿಳಿದಿದ್ದೀರಿ ಎಂಬುದನ್ನು ವಿವರಿಸಬೇಕು.

ML/AI ಗೆ ಅದೇ ನಿಯಮಗಳನ್ನು ಅನ್ವಯಿಸಿ

ML/AI ಪರಿಣತರಂತೆ ಪೋಸ್ ಕೊಡುವ ಕೆಲವು ಚಾರ್ಲಾಟನ್‌ಗಳನ್ನು ಗುರುತಿಸುವುದು ಕೂಡ ಸುಲಭ. ನೀವು ಯಾವುದೇ ಕೆಟ್ಟ ಇಂಜಿನಿಯರ್ ಅನ್ನು ಹಿಡಿಯುವ ರೀತಿಯಲ್ಲಿಯೇ ನೀವು ಅವರನ್ನು ಹಿಡಿಯುತ್ತೀರಿ: ಅವರು ನಿರ್ಮಿಸಲು ಪ್ರಯತ್ನಿಸುವ "ಪರಿಹಾರಗಳು" ನಿರಂತರವಾಗಿ ವಿಫಲಗೊಳ್ಳುತ್ತವೆ. ಆರಂಭಿಕ ಎಚ್ಚರಿಕೆಯ ಸಂಕೇತವೆಂದರೆ ಉದ್ಯಮದ ಪ್ರಮಾಣಿತ ಪ್ರೋಗ್ರಾಮಿಂಗ್ ಭಾಷೆಗಳು ಮತ್ತು ಗ್ರಂಥಾಲಯಗಳೊಂದಿಗೆ ಅನುಭವದ ಕೊರತೆ.

ಆದರೆ ಕೆಲಸ ಮಾಡುವ ವ್ಯವಸ್ಥೆಗಳನ್ನು ರಚಿಸುವ ಜನರ ಬಗ್ಗೆ ಏನು? ಅನುಮಾನಾಸ್ಪದವಾಗಿ ಏನಾದರೂ ನಡೆಯುತ್ತಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ಅದೇ ನಿಯಮ ಅನ್ವಯಿಸುತ್ತದೆ! ಚಾರ್ಲಾಟನ್ ಒಂದು ಕೆಟ್ಟ ಪಾತ್ರವಾಗಿದ್ದು, ಮಾದರಿಯು ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ...ಅವರು ಮಾದರಿಯನ್ನು ರಚಿಸಲು ಬಳಸಿದ ಅದೇ ಡೇಟಾದಲ್ಲಿ.

ನೀವು ಅತ್ಯಂತ ಸಂಕೀರ್ಣವಾದ ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಿದ್ದರೆ, ಅದು ಎಷ್ಟು ಒಳ್ಳೆಯದು ಎಂದು ನಿಮಗೆ ಹೇಗೆ ಗೊತ್ತು? ಅವಳು ಮೊದಲು ನೋಡದಿರುವ ಹೊಸ ಡೇಟಾದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುತ್ತಿರುವುದನ್ನು ನೀವು ತೋರಿಸುವವರೆಗೆ ನಿಮಗೆ ತಿಳಿದಿರುವುದಿಲ್ಲ.

ಮುನ್ಸೂಚನೆ ನೀಡುವ ಮೊದಲು ನೀವು ಡೇಟಾವನ್ನು ನೋಡಿದಾಗ - ಇದು ಅಸಂಭವವಾಗಿದೆ ಮೊದಲುಹೇಳುವುದು

ನೀವು ಪ್ರತ್ಯೇಕಿಸಲು ಸಾಕಷ್ಟು ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ, ಯೋಜನೆಯನ್ನು ಸಮರ್ಥಿಸಲು ನಿಮ್ಮ ಸೂತ್ರಗಳ ಸೌಂದರ್ಯವನ್ನು ನೀವು ಉಲ್ಲೇಖಿಸಬೇಕಾಗಿಲ್ಲ (ನಾನು ವಿಜ್ಞಾನದಲ್ಲಿ ಮಾತ್ರವಲ್ಲದೆ ಎಲ್ಲೆಡೆ ನೋಡುವ ಹಳೆಯ ಫ್ಯಾಷನ್ ಅಭ್ಯಾಸ). ನೀವು ಹೇಳಬಹುದು: "ಇದು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂದು ನನಗೆ ತಿಳಿದಿದೆ ಏಕೆಂದರೆ ನಾನು ಮೊದಲು ನೋಡದ ಡೇಟಾ ಸೆಟ್ ಅನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಹುದು ಮತ್ತು ಅಲ್ಲಿ ಏನಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಖರವಾಗಿ ಊಹಿಸಬಹುದು ... ಮತ್ತು ನಾನು ಸರಿಯಾಗಿರುತ್ತೇನೆ. ಮತ್ತೆ ಮತ್ತೆ".

ಹೊಸ ಡೇಟಾದ ವಿರುದ್ಧ ನಿಮ್ಮ ಮಾದರಿ/ಸಿದ್ಧಾಂತವನ್ನು ಪರೀಕ್ಷಿಸುವುದು ವಿಶ್ವಾಸಕ್ಕೆ ಉತ್ತಮ ಆಧಾರವಾಗಿದೆ.

ನಾನು ಡೇಟಾ ಚಾರ್ಲಾಟನ್ಸ್ ಅನ್ನು ಸಹಿಸುವುದಿಲ್ಲ. ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವು ವಿಭಿನ್ನ ತಂತ್ರಗಳನ್ನು ಆಧರಿಸಿದ್ದರೆ ನಾನು ಹೆದರುವುದಿಲ್ಲ. ವಿವರಣೆಗಳ ಸೌಂದರ್ಯದಿಂದ ನಾನು ಪ್ರಭಾವಿತನಾಗಲಿಲ್ಲ. ನೀವು ಹಿಂದೆಂದೂ ನೋಡಿರದ ಹೊಸ ಡೇಟಾದ ಸಂಪೂರ್ಣ ಗುಂಪಿನಲ್ಲಿ ನಿಮ್ಮ ಸಿದ್ಧಾಂತ/ಮಾದರಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ (ಮತ್ತು ಕೆಲಸ ಮಾಡುವುದನ್ನು ಮುಂದುವರಿಸುತ್ತದೆ) ಎಂದು ನನಗೆ ತೋರಿಸಿ. ಇದು ನಿಮ್ಮ ಅಭಿಪ್ರಾಯದ ಬಲದ ನಿಜವಾದ ಪರೀಕ್ಷೆಯಾಗಿದೆ.

ಡೇಟಾ ಸೈನ್ಸ್ ತಜ್ಞರನ್ನು ಸಂಪರ್ಕಿಸಲಾಗುತ್ತಿದೆ

ಈ ಹಾಸ್ಯವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಪ್ರತಿಯೊಬ್ಬರೂ ನಿಮ್ಮನ್ನು ಗಂಭೀರವಾಗಿ ಪರಿಗಣಿಸಲು ಬಯಸಿದರೆ, ವೈಯಕ್ತಿಕ ಪಕ್ಷಪಾತಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಅಲಂಕಾರಿಕ ಸಮೀಕರಣಗಳ ಹಿಂದೆ ಅಡಗಿಕೊಳ್ಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ನಿಮ್ಮ ಬಳಿ ಏನಿದೆ ಎಂದು ನನಗೆ ತೋರಿಸಿ. ನಿಮ್ಮ ಸಿದ್ಧಾಂತ/ಮಾದರಿಯನ್ನು ಕೇವಲ ಸ್ಪೂರ್ತಿದಾಯಕ ಕಾವ್ಯಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ "ಅದನ್ನು ಪಡೆಯುವವರು" ವೀಕ್ಷಿಸಬೇಕೆಂದು ನೀವು ಬಯಸಿದರೆ, ಅದು ಸಂಪೂರ್ಣವಾಗಿ ಹೊಸ ಡೇಟಾ ಸೆಟ್‌ನಲ್ಲಿ ಎಷ್ಟು ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ಸಾಕ್ಷಿಗಳ ಮುಂದೆ ಪ್ರದರ್ಶಿಸಲು ಧೈರ್ಯವನ್ನು ಹೊಂದಿರಿ. !

ಮುಖಂಡರಿಗೆ ಮನವಿ

ಡೇಟಾವನ್ನು ಪರೀಕ್ಷಿಸುವವರೆಗೆ ಯಾವುದೇ "ಕಲ್ಪನೆಗಳನ್ನು" ಗಂಭೀರವಾಗಿ ತೆಗೆದುಕೊಳ್ಳಲು ನಿರಾಕರಿಸಿ ಹೊಸದು ಡೇಟಾ. ಶ್ರಮ ಹಾಕಲು ಅನಿಸುತ್ತಿಲ್ಲವೇ? ವಿಶ್ಲೇಷಣೆಯೊಂದಿಗೆ ಅಂಟಿಕೊಳ್ಳಿ, ಆದರೆ ಈ ವಿಚಾರಗಳನ್ನು ಅವಲಂಬಿಸಬೇಡಿ-ಅವು ವಿಶ್ವಾಸಾರ್ಹವಲ್ಲ ಮತ್ತು ವಿಶ್ವಾಸಾರ್ಹತೆಗಾಗಿ ಪರೀಕ್ಷಿಸಲಾಗಿಲ್ಲ. ಇದಲ್ಲದೆ, ಸಂಸ್ಥೆಯು ಹೇರಳವಾಗಿ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವಾಗ, ವಿಜ್ಞಾನದಲ್ಲಿ ಪ್ರತ್ಯೇಕತೆಯನ್ನು ಮೂಲಭೂತವಾಗಿ ಮಾಡಲು ಮತ್ತು ಅಂಕಿಅಂಶಗಳಿಗೆ ಪರೀಕ್ಷಾ ಡೇಟಾಗೆ ಪ್ರವೇಶವನ್ನು ನಿಯಂತ್ರಿಸುವ ಮೂಲಕ ಮೂಲಸೌಕರ್ಯ ಮಟ್ಟದಲ್ಲಿ ಅದನ್ನು ನಿರ್ವಹಿಸಲು ಯಾವುದೇ ತೊಂದರೆಯಿಲ್ಲ. ಜನರು ನಿಮ್ಮನ್ನು ಮೋಸಗೊಳಿಸಲು ಪ್ರಯತ್ನಿಸುವುದನ್ನು ನಿಲ್ಲಿಸಲು ಇದು ಉತ್ತಮ ಮಾರ್ಗವಾಗಿದೆ!

ನೀವು ಚಾರ್ಲಾಟನ್‌ಗಳ ಹೆಚ್ಚಿನ ಉದಾಹರಣೆಗಳನ್ನು ನೋಡಲು ಬಯಸಿದರೆ ಒಳ್ಳೆಯದಲ್ಲ - Twitter ನಲ್ಲಿ ಅದ್ಭುತವಾದ ಥ್ರೆಡ್ ಇಲ್ಲಿದೆ.

ಫಲಿತಾಂಶಗಳು

ಪ್ರತ್ಯೇಕಿಸಲು ತುಂಬಾ ಕಡಿಮೆ ಡೇಟಾ ಇದ್ದಾಗ, ಚಾರ್ಲಾಟನ್ ಮಾತ್ರ ಅಮೇರಿಕಾವನ್ನು ಹಿಮ್ಮುಖವಾಗಿ ಕಂಡುಹಿಡಿಯುವ ಮೂಲಕ ಸ್ಫೂರ್ತಿಯನ್ನು ಕಟ್ಟುನಿಟ್ಟಾಗಿ ಅನುಸರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತಾನೆ, ಗಣಿತಶಾಸ್ತ್ರದಲ್ಲಿ ಈಗಾಗಲೇ ಡೇಟಾದಲ್ಲಿ ತಿಳಿದಿರುವ ವಿದ್ಯಮಾನಗಳನ್ನು ಮರುಶೋಧಿಸುತ್ತದೆ ಮತ್ತು ಆಶ್ಚರ್ಯವನ್ನು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯವಾಗಿ ಮಹತ್ವದ್ದಾಗಿದೆ. ಇದು ಸ್ಫೂರ್ತಿಯೊಂದಿಗೆ ವ್ಯವಹರಿಸುವ ಮುಕ್ತ ಮನಸ್ಸಿನ ವಿಶ್ಲೇಷಕರಿಂದ ಮತ್ತು ಮುನ್ಸೂಚನೆಗಳನ್ನು ಮಾಡುವಾಗ ಪುರಾವೆಗಳನ್ನು ನೀಡುವ ನಿಖರವಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರಿಂದ ಅವರನ್ನು ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ.

ಸಾಕಷ್ಟು ಡೇಟಾ ಇದ್ದಾಗ, ಡೇಟಾವನ್ನು ಬೇರ್ಪಡಿಸುವ ಅಭ್ಯಾಸವನ್ನು ಪಡೆದುಕೊಳ್ಳಿ ಇದರಿಂದ ನೀವು ಎರಡೂ ಪ್ರಪಂಚಗಳಲ್ಲಿ ಅತ್ಯುತ್ತಮವಾದದ್ದನ್ನು ಹೊಂದಬಹುದು! ಡೇಟಾದ ಮೂಲ ರಾಶಿಯ ಪ್ರತ್ಯೇಕ ಉಪವಿಭಾಗಗಳಿಗೆ ಪ್ರತ್ಯೇಕವಾಗಿ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಅಂಕಿಅಂಶಗಳನ್ನು ಮಾಡಲು ಮರೆಯದಿರಿ.

  • ವಿಶ್ಲೇಷಕರು ನಿಮಗೆ ಸ್ಫೂರ್ತಿ ಮತ್ತು ಮುಕ್ತ ಮನಸ್ಸನ್ನು ನೀಡುತ್ತದೆ.
  • ಅಂಕಿಅಂಶಗಳು ನಿಮಗೆ ಕಠಿಣ ಪರೀಕ್ಷೆಯನ್ನು ನೀಡುತ್ತವೆ.
  • ಚಾರ್ಲಾಟನ್ಸ್ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಅಂಕಿಅಂಶಗಳಂತೆ ನಟಿಸುವ ತಿರುಚಿದ ಹಿನ್ನೋಟವನ್ನು ನಿಮಗೆ ನೀಡುತ್ತವೆ.

ಬಹುಶಃ, ಲೇಖನವನ್ನು ಓದಿದ ನಂತರ, "ನಾನು ಚಾರ್ಲಾಟನ್" ಎಂಬ ಆಲೋಚನೆಯನ್ನು ನೀವು ಹೊಂದಿರಬಹುದೇ? ಇದು ಚೆನ್ನಾಗಿದೆ. ಈ ಆಲೋಚನೆಯನ್ನು ತೊಡೆದುಹಾಕಲು ಎರಡು ಮಾರ್ಗಗಳಿವೆ: ಮೊದಲು, ಹಿಂತಿರುಗಿ ನೋಡಿ, ನೀವು ಏನು ಮಾಡಿದ್ದೀರಿ ಎಂಬುದನ್ನು ನೋಡಿ, ಡೇಟಾದೊಂದಿಗೆ ನಿಮ್ಮ ಕೆಲಸವು ಪ್ರಾಯೋಗಿಕ ಪ್ರಯೋಜನವನ್ನು ತಂದಿದೆಯೇ. ಮತ್ತು ಎರಡನೆಯದಾಗಿ, ನಿಮ್ಮ ವಿದ್ಯಾರ್ಹತೆಗಳ ಮೇಲೆ ನೀವು ಇನ್ನೂ ಕೆಲಸ ಮಾಡಬಹುದು (ಅದು ಖಂಡಿತವಾಗಿಯೂ ಅತಿಯಾಗಿರುವುದಿಲ್ಲ), ವಿಶೇಷವಾಗಿ ನಾವು ನಮ್ಮ ವಿದ್ಯಾರ್ಥಿಗಳಿಗೆ ಪ್ರಾಯೋಗಿಕ ಕೌಶಲ್ಯ ಮತ್ತು ಜ್ಞಾನವನ್ನು ನೀಡುವುದರಿಂದ ಅವರಿಗೆ ನೈಜ ಡೇಟಾ ವಿಜ್ಞಾನಿಗಳಾಗಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಡೇಟಾ ಸೈನ್ಸ್ ಚಾರ್ಲಾಟನ್ ಅನ್ನು ಹೇಗೆ ಗುರುತಿಸುವುದು?

ಹೆಚ್ಚಿನ ಕೋರ್ಸ್‌ಗಳು

ಮತ್ತಷ್ಟು ಓದು

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ