ಬಿಗ್ ಡೇಟಾ ದೊಡ್ಡ ಬಿಲ್ಲಿಂಗ್: ಟೆಲಿಕಾಂನಲ್ಲಿ ಬಿಗ್‌ಡೇಟಾ ಕುರಿತು

2008 ರಲ್ಲಿ, ಬಿಗ್‌ಡೇಟಾ ಹೊಸ ಪದ ಮತ್ತು ಫ್ಯಾಶನ್ ಪ್ರವೃತ್ತಿಯಾಗಿದೆ. 2019 ರಲ್ಲಿ, ಬಿಗ್‌ಡೇಟಾ ಮಾರಾಟದ ವಸ್ತುವಾಗಿದೆ, ಲಾಭದ ಮೂಲವಾಗಿದೆ ಮತ್ತು ಹೊಸ ಬಿಲ್‌ಗಳಿಗೆ ಕಾರಣವಾಗಿದೆ.

ಕಳೆದ ಶರತ್ಕಾಲದಲ್ಲಿ, ರಷ್ಯಾದ ಸರ್ಕಾರವು ದೊಡ್ಡ ಡೇಟಾವನ್ನು ನಿಯಂತ್ರಿಸುವ ಮಸೂದೆಯನ್ನು ಪ್ರಾರಂಭಿಸಿತು. ವ್ಯಕ್ತಿಗಳನ್ನು ಮಾಹಿತಿಯಿಂದ ಗುರುತಿಸಲಾಗುವುದಿಲ್ಲ, ಆದರೆ ಫೆಡರಲ್ ಅಧಿಕಾರಿಗಳ ಕೋರಿಕೆಯ ಮೇರೆಗೆ ಹಾಗೆ ಮಾಡಬಹುದು. ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ BigData ಅನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು Roskomnadzor ನ ಅಧಿಸೂಚನೆಯ ನಂತರ ಮಾತ್ರ. 100 ಸಾವಿರಕ್ಕೂ ಹೆಚ್ಚು ನೆಟ್‌ವರ್ಕ್ ವಿಳಾಸಗಳನ್ನು ಹೊಂದಿರುವ ಕಂಪನಿಗಳು ಕಾನೂನಿನ ಅಡಿಯಲ್ಲಿ ಬರುತ್ತವೆ. ಮತ್ತು, ಸಹಜವಾಗಿ, ರೆಜಿಸ್ಟರ್‌ಗಳಿಲ್ಲದೆ - ಇದು ಡೇಟಾಬೇಸ್ ಆಪರೇಟರ್‌ಗಳ ಪಟ್ಟಿಯೊಂದಿಗೆ ಒಂದನ್ನು ರಚಿಸಬೇಕಾಗಿದೆ. ಮತ್ತು ಈ ಮೊದಲು ಬಿಗ್ ಡೇಟಾವನ್ನು ಎಲ್ಲರೂ ಗಂಭೀರವಾಗಿ ಪರಿಗಣಿಸದಿದ್ದರೆ, ಈಗ ಅದನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಬೇಕಾಗುತ್ತದೆ.

ನಾನು, ಈ ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವ ಬಿಲ್ಲಿಂಗ್ ಡೆವಲಪರ್ ಕಂಪನಿಯ ನಿರ್ದೇಶಕನಾಗಿ, ಡೇಟಾಬೇಸ್ ಅನ್ನು ನಿರ್ಲಕ್ಷಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳ ಪ್ರಿಸ್ಮ್ ಮೂಲಕ ನಾನು ದೊಡ್ಡ ಡೇಟಾದ ಬಗ್ಗೆ ಯೋಚಿಸುತ್ತೇನೆ, ಅವರ ಬಿಲ್ಲಿಂಗ್ ವ್ಯವಸ್ಥೆಗಳ ಮೂಲಕ ಪ್ರತಿದಿನ ಸಾವಿರಾರು ಚಂದಾದಾರರ ಬಗ್ಗೆ ಮಾಹಿತಿ ಹರಿಯುತ್ತದೆ.

ಪ್ರಮೇಯ

ಗಣಿತದ ಸಮಸ್ಯೆಯಂತೆ ಪ್ರಾರಂಭಿಸೋಣ: ಮೊದಲು ನಾವು ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳ ಡೇಟಾವನ್ನು ಬಿಗ್‌ಡಾಟ್ ಎಂದು ಕರೆಯಬಹುದು ಎಂದು ಸಾಬೀತುಪಡಿಸುತ್ತೇವೆ. ವಿಶಿಷ್ಟವಾಗಿ, ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಮೂರು VVV ಗುಣಲಕ್ಷಣಗಳಿಂದ ನಿರೂಪಿಸಲಾಗಿದೆ, ಆದಾಗ್ಯೂ ಉಚಿತ ವ್ಯಾಖ್ಯಾನಗಳಲ್ಲಿ "Vs" ಸಂಖ್ಯೆಯು ಏಳು ತಲುಪಿದೆ.

ಸಂಪುಟ. Rostelecom ನ MVNO ಮಾತ್ರ ಒಂದು ಮಿಲಿಯನ್‌ಗಿಂತಲೂ ಹೆಚ್ಚು ಚಂದಾದಾರರಿಗೆ ಸೇವೆ ಸಲ್ಲಿಸುತ್ತದೆ. ಪ್ರಮುಖ ಹೋಸ್ಟ್ ಆಪರೇಟರ್‌ಗಳು 44 ರಿಂದ 78 ಮಿಲಿಯನ್ ಜನರಿಗೆ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುತ್ತಾರೆ. ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ ದಟ್ಟಣೆ ಹೆಚ್ಚುತ್ತಿದೆ: 2019 ರ ಮೊದಲ ತ್ರೈಮಾಸಿಕದಲ್ಲಿ, ಚಂದಾದಾರರು ಈಗಾಗಲೇ ಮೊಬೈಲ್ ಫೋನ್‌ಗಳಿಂದ 3,3 ಬಿಲಿಯನ್ ಜಿಬಿಯನ್ನು ಪ್ರವೇಶಿಸಿದ್ದಾರೆ.

ವೇಗ. ಅಂಕಿಅಂಶಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಡೈನಾಮಿಕ್ಸ್ ಬಗ್ಗೆ ಯಾರೂ ನಿಮಗೆ ಹೇಳಲಾರರು, ಹಾಗಾಗಿ ನಾನು ಸಿಸ್ಕೋದ ಮುನ್ಸೂಚನೆಗಳ ಮೂಲಕ ಹೋಗುತ್ತೇನೆ. 2021 ರ ಹೊತ್ತಿಗೆ, IP ದಟ್ಟಣೆಯ 20% ಮೊಬೈಲ್ ಟ್ರಾಫಿಕ್‌ಗೆ ಹೋಗುತ್ತದೆ - ಇದು ಐದು ವರ್ಷಗಳಲ್ಲಿ ಸುಮಾರು ಮೂರು ಪಟ್ಟು ಹೆಚ್ಚಾಗುತ್ತದೆ. ಮೂರನೇ ಒಂದು ಭಾಗದಷ್ಟು ಮೊಬೈಲ್ ಸಂಪರ್ಕಗಳು M2M ಆಗಿರುತ್ತದೆ - IoT ಯ ಅಭಿವೃದ್ಧಿಯು ಸಂಪರ್ಕಗಳಲ್ಲಿ ಆರು ಪಟ್ಟು ಹೆಚ್ಚಳಕ್ಕೆ ಕಾರಣವಾಗುತ್ತದೆ. ಇಂಟರ್ನೆಟ್ ಆಫ್ ಥಿಂಗ್ಸ್ ಲಾಭದಾಯಕವಲ್ಲ, ಆದರೆ ಸಂಪನ್ಮೂಲ-ತೀವ್ರವಾಗಿರುತ್ತದೆ, ಆದ್ದರಿಂದ ಕೆಲವು ನಿರ್ವಾಹಕರು ಅದರ ಮೇಲೆ ಮಾತ್ರ ಕೇಂದ್ರೀಕರಿಸುತ್ತಾರೆ. ಮತ್ತು IoT ಅನ್ನು ಪ್ರತ್ಯೇಕ ಸೇವೆಯಾಗಿ ಅಭಿವೃದ್ಧಿಪಡಿಸುವವರು ಡಬಲ್ ಟ್ರಾಫಿಕ್ ಅನ್ನು ಸ್ವೀಕರಿಸುತ್ತಾರೆ.

ವೆರೈಟಿ. ವೈವಿಧ್ಯತೆಯು ಒಂದು ವ್ಯಕ್ತಿನಿಷ್ಠ ಪರಿಕಲ್ಪನೆಯಾಗಿದೆ, ಆದರೆ ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳು ನಿಜವಾಗಿಯೂ ತಮ್ಮ ಚಂದಾದಾರರ ಬಗ್ಗೆ ಎಲ್ಲವನ್ನೂ ತಿಳಿದಿದ್ದಾರೆ. ಹೆಸರು ಮತ್ತು ಪಾಸ್‌ಪೋರ್ಟ್ ವಿವರಗಳಿಂದ ಫೋನ್ ಮಾಡೆಲ್, ಖರೀದಿಗಳು, ಭೇಟಿ ನೀಡಿದ ಸ್ಥಳಗಳು ಮತ್ತು ಆಸಕ್ತಿಗಳವರೆಗೆ. ಯಾರೋವಾಯಾ ಕಾನೂನಿನ ಪ್ರಕಾರ, ಮಾಧ್ಯಮ ಫೈಲ್ಗಳನ್ನು ಆರು ತಿಂಗಳವರೆಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ ಸಂಗ್ರಹಿಸಿದ ಡೇಟಾವು ವೈವಿಧ್ಯಮಯವಾಗಿದೆ ಎಂಬ ಮೂಲತತ್ವವಾಗಿ ತೆಗೆದುಕೊಳ್ಳೋಣ.

ತಂತ್ರಾಂಶ ಮತ್ತು ವಿಧಾನ

ಪೂರೈಕೆದಾರರು ಬಿಗ್‌ಡೇಟಾದ ಪ್ರಮುಖ ಗ್ರಾಹಕರಲ್ಲಿ ಒಬ್ಬರು, ಆದ್ದರಿಂದ ಹೆಚ್ಚಿನ ದೊಡ್ಡ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ತಂತ್ರಗಳು ಟೆಲಿಕಾಂ ಉದ್ಯಮಕ್ಕೆ ಅನ್ವಯಿಸುತ್ತವೆ. ಎಂಎಲ್, ಎಐ, ಡೀಪ್ ಲರ್ನಿಂಗ್, ಡೇಟಾ ಸೆಂಟರ್‌ಗಳಲ್ಲಿ ಹೂಡಿಕೆ ಮತ್ತು ಡೇಟಾ ಮೈನಿಂಗ್‌ನಲ್ಲಿ ಹೂಡಿಕೆ ಮಾಡಲು ಯಾರು ಸಿದ್ಧರಾಗಿದ್ದಾರೆ ಎಂಬುದು ಇನ್ನೊಂದು ಪ್ರಶ್ನೆ. ಡೇಟಾಬೇಸ್‌ನೊಂದಿಗೆ ಪೂರ್ಣ ಪ್ರಮಾಣದ ಕೆಲಸವು ಮೂಲಸೌಕರ್ಯ ಮತ್ತು ತಂಡವನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ, ಅದರ ವೆಚ್ಚವನ್ನು ಪ್ರತಿಯೊಬ್ಬರೂ ಭರಿಸಲಾಗುವುದಿಲ್ಲ. ಈಗಾಗಲೇ ಕಾರ್ಪೊರೇಟ್ ವೇರ್‌ಹೌಸ್ ಹೊಂದಿರುವ ಅಥವಾ ಡೇಟಾ ಆಡಳಿತ ವಿಧಾನವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಿರುವ ಎಂಟರ್‌ಪ್ರೈಸ್‌ಗಳು ಬಿಗ್‌ಡೇಟಾದಲ್ಲಿ ಬಾಜಿ ಕಟ್ಟಬೇಕು. ದೀರ್ಘಕಾಲೀನ ಹೂಡಿಕೆಗಳಿಗೆ ಇನ್ನೂ ಸಿದ್ಧವಾಗಿಲ್ಲದವರಿಗೆ, ಸಾಫ್ಟ್‌ವೇರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು ಕ್ರಮೇಣವಾಗಿ ನಿರ್ಮಿಸಲು ಮತ್ತು ಘಟಕಗಳನ್ನು ಒಂದೊಂದಾಗಿ ಸ್ಥಾಪಿಸಲು ನಾನು ನಿಮಗೆ ಸಲಹೆ ನೀಡುತ್ತೇನೆ. ನೀವು ಹೆವಿ ಮಾಡ್ಯೂಲ್ ಮತ್ತು ಹಡೂಪ್ ಅನ್ನು ಕೊನೆಯದಾಗಿ ಬಿಡಬಹುದು. ಡೇಟಾ ಗುಣಮಟ್ಟ ಮತ್ತು ಡೇಟಾ ಮೈನಿಂಗ್‌ನಂತಹ ಸಮಸ್ಯೆಗಳಿಗೆ ಕೆಲವು ಜನರು ಸಿದ್ಧ ಪರಿಹಾರವನ್ನು ಖರೀದಿಸುತ್ತಾರೆ; ಕಂಪನಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ತಮ್ಮ ನಿರ್ದಿಷ್ಟ ವಿಶೇಷಣಗಳು ಮತ್ತು ಅಗತ್ಯಗಳಿಗೆ ವ್ಯವಸ್ಥೆಯನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡುತ್ತವೆ - ಸ್ವತಃ ಅಥವಾ ಡೆವಲಪರ್‌ಗಳ ಸಹಾಯದಿಂದ.

ಆದರೆ ಪ್ರತಿ ಬಿಲ್ಲಿಂಗ್ ಅನ್ನು ಬಿಗ್‌ಡೇಟಾದೊಂದಿಗೆ ಕೆಲಸ ಮಾಡಲು ಮಾರ್ಪಡಿಸಲಾಗುವುದಿಲ್ಲ. ಅಥವಾ ಬದಲಿಗೆ, ಎಲ್ಲವನ್ನೂ ಮಾತ್ರ ಮಾರ್ಪಡಿಸಲಾಗುವುದಿಲ್ಲ. ಕೆಲವೇ ಜನರು ಇದನ್ನು ಮಾಡಬಹುದು.

ಬಿಲ್ಲಿಂಗ್ ವ್ಯವಸ್ಥೆಯು ಡೇಟಾಬೇಸ್ ಸಂಸ್ಕರಣಾ ಸಾಧನವಾಗಲು ಅವಕಾಶವನ್ನು ಹೊಂದಿರುವ ಮೂರು ಚಿಹ್ನೆಗಳು:

  • ಸಮತಲ ಸ್ಕೇಲೆಬಿಲಿಟಿ. ಸಾಫ್ಟ್‌ವೇರ್ ಹೊಂದಿಕೊಳ್ಳುವಂತಿರಬೇಕು - ನಾವು ದೊಡ್ಡ ಡೇಟಾದ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದೇವೆ. ಕ್ಲಸ್ಟರ್‌ನಲ್ಲಿನ ಹಾರ್ಡ್‌ವೇರ್‌ನ ಪ್ರಮಾಣಾನುಗುಣ ಹೆಚ್ಚಳದಿಂದ ಮಾಹಿತಿಯ ಪ್ರಮಾಣದಲ್ಲಿ ಹೆಚ್ಚಳವನ್ನು ಪರಿಗಣಿಸಬೇಕು.
  • ದೋಷಸಹಿಷ್ಣುತೆ. ಗಂಭೀರ ಪ್ರಿಪೇಯ್ಡ್ ವ್ಯವಸ್ಥೆಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಪೂರ್ವನಿಯೋಜಿತವಾಗಿ ದೋಷ-ಸಹಿಷ್ಣುವಾಗಿರುತ್ತವೆ: ಬಿಲ್ಲಿಂಗ್ ಅನ್ನು ಹಲವಾರು ಜಿಯೋಲೊಕೇಶನ್‌ಗಳಲ್ಲಿ ಕ್ಲಸ್ಟರ್‌ನಲ್ಲಿ ನಿಯೋಜಿಸಲಾಗಿದೆ ಇದರಿಂದ ಅವುಗಳು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪರಸ್ಪರ ವಿಮೆ ಮಾಡುತ್ತವೆ. ಒಂದು ಅಥವಾ ಹೆಚ್ಚು ವಿಫಲವಾದರೆ ಹಡೂಪ್ ಕ್ಲಸ್ಟರ್‌ನಲ್ಲಿ ಸಾಕಷ್ಟು ಕಂಪ್ಯೂಟರ್‌ಗಳು ಸಹ ಇರಬೇಕು.
  • ಸ್ಥಳೀಯತೆ. ಡೇಟಾವನ್ನು ಒಂದು ಸರ್ವರ್‌ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಬೇಕು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಬೇಕು, ಇಲ್ಲದಿದ್ದರೆ ನೀವು ಡೇಟಾ ವರ್ಗಾವಣೆಯಲ್ಲಿ ಮುರಿದು ಹೋಗಬಹುದು. ಜನಪ್ರಿಯ ನಕ್ಷೆ-ಕಡಿಮೆ ವಿಧಾನ ಯೋಜನೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ: HDFS ಸ್ಟೋರ್‌ಗಳು, ಸ್ಪಾರ್ಕ್ ಪ್ರಕ್ರಿಯೆಗಳು. ತಾತ್ತ್ವಿಕವಾಗಿ, ಸಾಫ್ಟ್‌ವೇರ್ ಡೇಟಾ ಸೆಂಟರ್ ಮೂಲಸೌಕರ್ಯಕ್ಕೆ ಮನಬಂದಂತೆ ಸಂಯೋಜಿಸಬೇಕು ಮತ್ತು ಒಂದರಲ್ಲಿ ಮೂರು ವಿಷಯಗಳನ್ನು ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ: ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಿ, ಸಂಘಟಿಸಿ ಮತ್ತು ವಿಶ್ಲೇಷಿಸಿ.

ತಂಡದ

ಏನು, ಹೇಗೆ ಮತ್ತು ಯಾವ ಉದ್ದೇಶಕ್ಕಾಗಿ ಪ್ರೋಗ್ರಾಂ ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ತಂಡವು ನಿರ್ಧರಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ ಇದು ಒಬ್ಬ ವ್ಯಕ್ತಿಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ - ಡೇಟಾ ವಿಜ್ಞಾನಿ. ಆದಾಗ್ಯೂ, ನನ್ನ ಅಭಿಪ್ರಾಯದಲ್ಲಿ, ಬಿಗ್ ಡೇಟಾಗಾಗಿ ಉದ್ಯೋಗಿಗಳ ಕನಿಷ್ಠ ಪ್ಯಾಕೇಜ್ ಉತ್ಪನ್ನ ನಿರ್ವಾಹಕ, ಡೇಟಾ ಇಂಜಿನಿಯರ್ ಮತ್ತು ಮ್ಯಾನೇಜರ್ ಅನ್ನು ಸಹ ಒಳಗೊಂಡಿದೆ. ಮೊದಲನೆಯದು ಸೇವೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತದೆ, ತಾಂತ್ರಿಕ ಭಾಷೆಯನ್ನು ಮಾನವ ಭಾಷೆಗೆ ಅನುವಾದಿಸುತ್ತದೆ ಮತ್ತು ಪ್ರತಿಯಾಗಿ. ಡೇಟಾ ಇಂಜಿನಿಯರ್ ಜಾವಾ/ಸ್ಕಾಲಾ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆಯ ಪ್ರಯೋಗಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮಾದರಿಗಳಿಗೆ ಜೀವ ತುಂಬುತ್ತಾರೆ. ಮ್ಯಾನೇಜರ್ ಸಮನ್ವಯಗೊಳಿಸುತ್ತದೆ, ಗುರಿಗಳನ್ನು ಹೊಂದಿಸುತ್ತದೆ ಮತ್ತು ಹಂತಗಳನ್ನು ನಿಯಂತ್ರಿಸುತ್ತದೆ.

ತೊಂದರೆಗಳು

ಬಿಗ್‌ಡೇಟಾ ತಂಡದ ಕಡೆಯಿಂದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವಾಗ ಸಾಮಾನ್ಯವಾಗಿ ಸಮಸ್ಯೆಗಳು ಉದ್ಭವಿಸುತ್ತವೆ. ಪ್ರೋಗ್ರಾಂ ಏನನ್ನು ಸಂಗ್ರಹಿಸಬೇಕು ಮತ್ತು ಅದನ್ನು ಹೇಗೆ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಬೇಕು ಎಂಬುದನ್ನು ವಿವರಿಸುವ ಅಗತ್ಯವಿದೆ - ಇದನ್ನು ವಿವರಿಸಲು, ನೀವು ಮೊದಲು ಅದನ್ನು ನೀವೇ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕು. ಆದರೆ ಪೂರೈಕೆದಾರರಿಗೆ, ವಿಷಯಗಳು ಅಷ್ಟು ಸುಲಭವಲ್ಲ. ಚಂದಾದಾರರ ಮಂಥನವನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಕಾರ್ಯದ ಉದಾಹರಣೆಯನ್ನು ಬಳಸಿಕೊಂಡು ನಾನು ಸಮಸ್ಯೆಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದೇನೆ - ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳು ಬಿಗ್ ಡೇಟಾದ ಸಹಾಯದಿಂದ ಮೊದಲ ಸ್ಥಾನದಲ್ಲಿ ಪರಿಹರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದಾರೆ.

ಗುರಿಗಳನ್ನು ಹೊಂದಿಸುವುದು. ಚೆನ್ನಾಗಿ ಬರೆಯಲಾದ ತಾಂತ್ರಿಕ ವಿಶೇಷಣಗಳು ಮತ್ತು ಪದಗಳ ವಿಭಿನ್ನ ತಿಳುವಳಿಕೆಗಳು ಸ್ವತಂತ್ರೋದ್ಯೋಗಿಗಳಿಗೆ ಮಾತ್ರವಲ್ಲದೆ ಶತಮಾನಗಳ-ಹಳೆಯ ನೋವು. "ಕೈಬಿಡಲಾದ" ಚಂದಾದಾರರನ್ನು ಸಹ ವಿಭಿನ್ನ ರೀತಿಯಲ್ಲಿ ವ್ಯಾಖ್ಯಾನಿಸಬಹುದು - ಒಂದು ತಿಂಗಳು, ಆರು ತಿಂಗಳು ಅಥವಾ ಒಂದು ವರ್ಷದವರೆಗೆ ಆಪರೇಟರ್ ಸೇವೆಗಳನ್ನು ಬಳಸದಿರುವವರು. ಮತ್ತು ಐತಿಹಾಸಿಕ ಡೇಟಾದ ಆಧಾರದ ಮೇಲೆ MVP ಅನ್ನು ರಚಿಸಲು, ನೀವು ಮಂಥನದಿಂದ ಚಂದಾದಾರರ ಆದಾಯದ ಆವರ್ತನವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕು - ಇತರ ನಿರ್ವಾಹಕರನ್ನು ಪ್ರಯತ್ನಿಸಿದವರು ಅಥವಾ ನಗರವನ್ನು ತೊರೆದವರು ಮತ್ತು ಬೇರೆ ಸಂಖ್ಯೆಯನ್ನು ಬಳಸಿದವರು. ಮತ್ತೊಂದು ಪ್ರಮುಖ ಪ್ರಶ್ನೆ: ಚಂದಾದಾರರು ಎಷ್ಟು ಸಮಯದ ಮೊದಲು ಹೊರಡುವ ನಿರೀಕ್ಷೆಯಿದೆ ಎಂಬುದನ್ನು ಒದಗಿಸುವವರು ನಿರ್ಧರಿಸಬೇಕು ಮತ್ತು ಕ್ರಮ ತೆಗೆದುಕೊಳ್ಳಬೇಕು? ಆರು ತಿಂಗಳು ತುಂಬಾ ಮುಂಚೆಯೇ, ಒಂದು ವಾರ ತಡವಾಗಿದೆ.

ಪರಿಕಲ್ಪನೆಗಳ ಪರ್ಯಾಯ. ವಿಶಿಷ್ಟವಾಗಿ, ಆಪರೇಟರ್‌ಗಳು ಕ್ಲೈಂಟ್ ಅನ್ನು ಫೋನ್ ಸಂಖ್ಯೆಯ ಮೂಲಕ ಗುರುತಿಸುತ್ತಾರೆ, ಆದ್ದರಿಂದ ಅದನ್ನು ಬಳಸಿಕೊಂಡು ಚಿಹ್ನೆಗಳನ್ನು ಅಪ್‌ಲೋಡ್ ಮಾಡಬೇಕು ಎಂಬುದು ತಾರ್ಕಿಕವಾಗಿದೆ. ನಿಮ್ಮ ವೈಯಕ್ತಿಕ ಖಾತೆ ಅಥವಾ ಸೇವಾ ಅಪ್ಲಿಕೇಶನ್ ಸಂಖ್ಯೆಯ ಬಗ್ಗೆ ಏನು? ಕ್ಲೈಂಟ್ ಆಗಿ ಯಾವ ಘಟಕವನ್ನು ತೆಗೆದುಕೊಳ್ಳಬೇಕು ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸುವ ಅವಶ್ಯಕತೆಯಿದೆ ಆದ್ದರಿಂದ ಆಪರೇಟರ್ನ ಸಿಸ್ಟಮ್ನಲ್ಲಿನ ಡೇಟಾವು ಬದಲಾಗುವುದಿಲ್ಲ. ಕ್ಲೈಂಟ್‌ನ ಮೌಲ್ಯವನ್ನು ನಿರ್ಣಯಿಸುವುದು ಸಹ ಪ್ರಶ್ನಾರ್ಹವಾಗಿದೆ - ಯಾವ ಚಂದಾದಾರರು ಕಂಪನಿಗೆ ಹೆಚ್ಚು ಮೌಲ್ಯಯುತವಾಗಿದೆ, ಯಾವ ಬಳಕೆದಾರರನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು ಹೆಚ್ಚಿನ ಪ್ರಯತ್ನ ಬೇಕಾಗುತ್ತದೆ ಮತ್ತು ಯಾವುದೇ ಸಂದರ್ಭದಲ್ಲಿ "ಬೀಳುತ್ತಾರೆ" ಮತ್ತು ಅವರ ಮೇಲೆ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಖರ್ಚು ಮಾಡುವುದರಲ್ಲಿ ಯಾವುದೇ ಅರ್ಥವಿಲ್ಲ.

ಮಾಹಿತಿಯ ಕೊರತೆ. ಸಬ್‌ಸ್ಕ್ರೈಬರ್ ಮಂಥನದ ಮೇಲೆ ನಿರ್ದಿಷ್ಟವಾಗಿ ಏನು ಪರಿಣಾಮ ಬೀರುತ್ತದೆ ಮತ್ತು ಬಿಲ್ಲಿಂಗ್‌ನಲ್ಲಿ ಸಂಭವನೀಯ ಅಂಶಗಳನ್ನು ಹೇಗೆ ಲೆಕ್ಕಹಾಕಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಎಲ್ಲಾ ಪೂರೈಕೆದಾರ ಉದ್ಯೋಗಿಗಳು BigData ತಂಡಕ್ಕೆ ವಿವರಿಸಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ. ಅವರು ಅವುಗಳಲ್ಲಿ ಒಂದನ್ನು ಹೆಸರಿಸಿದರೂ ಸಹ - ARPU - ಅದನ್ನು ವಿಭಿನ್ನ ರೀತಿಯಲ್ಲಿ ಲೆಕ್ಕಹಾಕಬಹುದು: ಆವರ್ತಕ ಕ್ಲೈಂಟ್ ಪಾವತಿಗಳಿಂದ ಅಥವಾ ಸ್ವಯಂಚಾಲಿತ ಬಿಲ್ಲಿಂಗ್ ಶುಲ್ಕಗಳ ಮೂಲಕ. ಮತ್ತು ಕೆಲಸದ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ಒಂದು ಮಿಲಿಯನ್ ಇತರ ಪ್ರಶ್ನೆಗಳು ಉದ್ಭವಿಸುತ್ತವೆ. ಮಾದರಿಯು ಎಲ್ಲಾ ಕ್ಲೈಂಟ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿದೆಯೇ, ಕ್ಲೈಂಟ್ ಅನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು ಬೆಲೆ ಏನು, ಪರ್ಯಾಯ ಮಾದರಿಗಳ ಮೂಲಕ ಯೋಚಿಸುವುದರಲ್ಲಿ ಏನಾದರೂ ಅರ್ಥವಿದೆಯೇ ಮತ್ತು ತಪ್ಪಾಗಿ ಕೃತಕವಾಗಿ ಉಳಿಸಿಕೊಂಡಿರುವ ಗ್ರಾಹಕರೊಂದಿಗೆ ಏನು ಮಾಡಬೇಕು.

ಗುರಿ ನಿರ್ಧಾರ. ಆಪರೇಟರ್‌ಗಳು ಡೇಟಾಬೇಸ್‌ನೊಂದಿಗೆ ನಿರಾಶೆಗೊಳ್ಳಲು ಕಾರಣವಾಗುವ ಮೂರು ರೀತಿಯ ಫಲಿತಾಂಶ ದೋಷಗಳ ಬಗ್ಗೆ ನನಗೆ ತಿಳಿದಿದೆ.

  1. ಒದಗಿಸುವವರು ಬಿಗ್‌ಡೇಟಾದಲ್ಲಿ ಹೂಡಿಕೆ ಮಾಡುತ್ತಾರೆ, ಗಿಗಾಬೈಟ್‌ಗಳ ಮಾಹಿತಿಯನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತಾರೆ, ಆದರೆ ಅಗ್ಗವಾಗಿ ಪಡೆಯಬಹುದಾದ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯುತ್ತಾರೆ. ಸರಳ ರೇಖಾಚಿತ್ರಗಳು ಮತ್ತು ಮಾದರಿಗಳು, ಪ್ರಾಚೀನ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ವೆಚ್ಚವು ಹಲವು ಪಟ್ಟು ಹೆಚ್ಚಾಗಿದೆ, ಆದರೆ ಫಲಿತಾಂಶವು ಒಂದೇ ಆಗಿರುತ್ತದೆ.
  2. ನಿರ್ವಾಹಕರು ಬಹುಮುಖಿ ಡೇಟಾವನ್ನು ಔಟ್ಪುಟ್ ಆಗಿ ಸ್ವೀಕರಿಸುತ್ತಾರೆ, ಆದರೆ ಅದನ್ನು ಹೇಗೆ ಬಳಸಬೇಕೆಂದು ಅರ್ಥವಾಗುವುದಿಲ್ಲ. ವಿಶ್ಲೇಷಣೆ ಇದೆ - ಇಲ್ಲಿ ಅದು ಅರ್ಥವಾಗುವಂತಹದ್ದಾಗಿದೆ ಮತ್ತು ದೊಡ್ಡದಾಗಿದೆ, ಆದರೆ ಇದು ಯಾವುದೇ ಪ್ರಯೋಜನವಿಲ್ಲ. "ಡೇಟಾವನ್ನು ಸಂಸ್ಕರಿಸುವ" ಗುರಿಯನ್ನು ಒಳಗೊಂಡಿರದ ಅಂತಿಮ ಫಲಿತಾಂಶವನ್ನು ಯೋಚಿಸಲಾಗಿಲ್ಲ. ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಇದು ಸಾಕಾಗುವುದಿಲ್ಲ - ವ್ಯಾಪಾರ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ನವೀಕರಿಸಲು ವಿಶ್ಲೇಷಣೆಗಳು ಆಧಾರವಾಗಿರಬೇಕು.
  3. ಬಿಗ್‌ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗಳ ಬಳಕೆಗೆ ಅಡೆತಡೆಗಳು ಹಳೆಯ ವ್ಯವಹಾರ ಪ್ರಕ್ರಿಯೆಗಳು ಮತ್ತು ಹೊಸ ಉದ್ದೇಶಗಳಿಗೆ ಸೂಕ್ತವಲ್ಲದ ಸಾಫ್ಟ್‌ವೇರ್ ಆಗಿರಬಹುದು. ಇದರರ್ಥ ಅವರು ತಯಾರಿ ಹಂತದಲ್ಲಿ ತಪ್ಪು ಮಾಡಿದ್ದಾರೆ - ಅವರು ಕ್ರಿಯೆಗಳ ಅಲ್ಗಾರಿದಮ್ ಮತ್ತು ಬಿಗ್ ಡೇಟಾವನ್ನು ಕೆಲಸದಲ್ಲಿ ಪರಿಚಯಿಸುವ ಹಂತಗಳ ಮೂಲಕ ಯೋಚಿಸಲಿಲ್ಲ.

ಏಕೆ

ಫಲಿತಾಂಶಗಳ ಕುರಿತು ಮಾತನಾಡುತ್ತಾ. ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳು ಈಗಾಗಲೇ ಬಳಸುತ್ತಿರುವ ಬಿಗ್ ಡಾಟಾವನ್ನು ಬಳಸುವ ಮತ್ತು ಹಣಗಳಿಸುವ ವಿಧಾನಗಳನ್ನು ನಾನು ಪರಿಶೀಲಿಸುತ್ತೇನೆ.
ಪೂರೈಕೆದಾರರು ಚಂದಾದಾರರ ಹೊರಹರಿವು ಮಾತ್ರವಲ್ಲದೆ ಬೇಸ್ ಸ್ಟೇಷನ್‌ಗಳ ಮೇಲಿನ ಹೊರೆಯನ್ನೂ ಸಹ ಊಹಿಸುತ್ತಾರೆ.

  1. ಚಂದಾದಾರರ ಚಲನೆಗಳು, ಚಟುವಟಿಕೆ ಮತ್ತು ಆವರ್ತನ ಸೇವೆಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ವಿಶ್ಲೇಷಿಸಲಾಗುತ್ತದೆ. ಫಲಿತಾಂಶ: ಮೂಲಸೌಕರ್ಯದ ಸಮಸ್ಯೆಯ ಪ್ರದೇಶಗಳ ಆಪ್ಟಿಮೈಸೇಶನ್ ಮತ್ತು ಆಧುನೀಕರಣದ ಕಾರಣದಿಂದಾಗಿ ಓವರ್ಲೋಡ್ಗಳ ಸಂಖ್ಯೆಯಲ್ಲಿ ಕಡಿತ.
  2. ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳು ಮಾರಾಟದ ಬಿಂದುಗಳನ್ನು ತೆರೆಯುವಾಗ ಚಂದಾದಾರರ ಜಿಯೋಲೊಕೇಶನ್ ಮತ್ತು ಟ್ರಾಫಿಕ್ ಸಾಂದ್ರತೆಯ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಬಳಸುತ್ತಾರೆ. ಹೀಗಾಗಿ, ಹೊಸ ಕಚೇರಿಗಳ ಸ್ಥಳವನ್ನು ಯೋಜಿಸಲು ಬಿಗ್‌ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ಈಗಾಗಲೇ MTS ಮತ್ತು VimpelCom ಬಳಸುತ್ತದೆ.
  3. ಪೂರೈಕೆದಾರರು ತಮ್ಮ ದೊಡ್ಡ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ನೀಡುವ ಮೂಲಕ ಹಣಗಳಿಸುತ್ತಾರೆ. ಬಿಗ್‌ಡೇಟಾ ಆಪರೇಟರ್‌ಗಳ ಮುಖ್ಯ ಗ್ರಾಹಕರು ವಾಣಿಜ್ಯ ಬ್ಯಾಂಕ್‌ಗಳು. ಡೇಟಾಬೇಸ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು, ಅವರು ಕಾರ್ಡ್‌ಗಳನ್ನು ಲಿಂಕ್ ಮಾಡಿರುವ ಚಂದಾದಾರರ SIM ಕಾರ್ಡ್‌ನ ಅನುಮಾನಾಸ್ಪದ ಚಟುವಟಿಕೆಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುತ್ತಾರೆ ಮತ್ತು ಅಪಾಯದ ಸ್ಕೋರಿಂಗ್, ಪರಿಶೀಲನೆ ಮತ್ತು ಮೇಲ್ವಿಚಾರಣಾ ಸೇವೆಗಳನ್ನು ಬಳಸುತ್ತಾರೆ. ಮತ್ತು 2017 ರಲ್ಲಿ, ಮಾಸ್ಕೋ ಸರ್ಕಾರವು ತಾಂತ್ರಿಕ ಮತ್ತು ಸಾರಿಗೆ ಮೂಲಸೌಕರ್ಯವನ್ನು ಯೋಜಿಸಲು Tele2 ನಿಂದ BigData ಡೇಟಾವನ್ನು ಆಧರಿಸಿ ಚಲನೆಯ ಡೈನಾಮಿಕ್ಸ್ ಅನ್ನು ವಿನಂತಿಸಿತು.
  4. ಬಿಗ್‌ಡೇಟಾ ಅನಾಲಿಟಿಕ್ಸ್ ಮಾರಾಟಗಾರರಿಗೆ ಚಿನ್ನದ ಗಣಿಯಾಗಿದೆ, ಅವರು ಆಯ್ಕೆ ಮಾಡಿದರೆ ಸಾವಿರಾರು ಚಂದಾದಾರರ ಗುಂಪುಗಳಿಗೆ ವೈಯಕ್ತಿಕಗೊಳಿಸಿದ ಜಾಹೀರಾತು ಪ್ರಚಾರಗಳನ್ನು ರಚಿಸಬಹುದು. ಟೆಲಿಕಾಂ ಕಂಪನಿಗಳು ಸಾಮಾಜಿಕ ಪ್ರೊಫೈಲ್‌ಗಳು, ಗ್ರಾಹಕರ ಆಸಕ್ತಿಗಳು ಮತ್ತು ಚಂದಾದಾರರ ವರ್ತನೆಯ ಮಾದರಿಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸುತ್ತವೆ ಮತ್ತು ನಂತರ ಹೊಸ ಗ್ರಾಹಕರನ್ನು ಆಕರ್ಷಿಸಲು ಸಂಗ್ರಹಿಸಿದ ಬಿಗ್‌ಡೇಟಾವನ್ನು ಬಳಸುತ್ತವೆ. ಆದರೆ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಪ್ರಚಾರ ಮತ್ತು PR ಯೋಜನೆಗಾಗಿ, ಬಿಲ್ಲಿಂಗ್ ಯಾವಾಗಲೂ ಸಾಕಷ್ಟು ಕಾರ್ಯವನ್ನು ಹೊಂದಿರುವುದಿಲ್ಲ: ಪ್ರೋಗ್ರಾಂ ಏಕಕಾಲದಲ್ಲಿ ಗ್ರಾಹಕರ ಬಗ್ಗೆ ವಿವರವಾದ ಮಾಹಿತಿಯೊಂದಿಗೆ ಸಮಾನಾಂತರವಾಗಿ ಅನೇಕ ಅಂಶಗಳನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಬೇಕು.

ಕೆಲವರು ಇನ್ನೂ ಬಿಗ್‌ಡೇಟಾವನ್ನು ಖಾಲಿ ನುಡಿಗಟ್ಟು ಎಂದು ಪರಿಗಣಿಸಿದರೆ, ಬಿಗ್ ಫೋರ್ ಈಗಾಗಲೇ ಅದರಲ್ಲಿ ಹಣವನ್ನು ಗಳಿಸುತ್ತಿದ್ದಾರೆ. MTS ಆರು ತಿಂಗಳಲ್ಲಿ ದೊಡ್ಡ ಡೇಟಾ ಸಂಸ್ಕರಣೆಯಿಂದ 14 ಶತಕೋಟಿ ರೂಬಲ್ಸ್ಗಳನ್ನು ಗಳಿಸುತ್ತದೆ ಮತ್ತು Tele2 ಯೋಜನೆಗಳಿಂದ ಆದಾಯವನ್ನು ಮೂರುವರೆ ಪಟ್ಟು ಹೆಚ್ಚಿಸಿದೆ. ಬಿಗ್‌ಡೇಟಾ ಟ್ರೆಂಡ್‌ನಿಂದ ಹೊಂದಿರಲೇಬೇಕಾದ ಪ್ರವೃತ್ತಿಯಾಗಿ ಬದಲಾಗುತ್ತಿದೆ, ಅದರ ಅಡಿಯಲ್ಲಿ ಟೆಲಿಕಾಂ ಆಪರೇಟರ್‌ಗಳ ಸಂಪೂರ್ಣ ರಚನೆಯನ್ನು ಮರುನಿರ್ಮಾಣ ಮಾಡಲಾಗುತ್ತದೆ.

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ