ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ನಮ್ಮ ಭವಿಷ್ಯದ ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ವ್ಯವಸ್ಥೆಗಾಗಿ ತಂತ್ರಜ್ಞಾನಗಳು ಮತ್ತು ಮಾದರಿಗಳನ್ನು ಕ್ರಮೇಣವಾಗಿ ಮತ್ತು ನಮ್ಮ ಕಂಪನಿಯ ವಿವಿಧ ಯೋಜನೆಗಳಲ್ಲಿ - ಮೇಲ್, ಮೇಘ, ಹುಡುಕಾಟದಲ್ಲಿ ರಚಿಸಲಾಗಿದೆ ಮತ್ತು ಸುಧಾರಿಸಲಾಗಿದೆ. ಅವರು ಉತ್ತಮ ಚೀಸ್ ಅಥವಾ ಕಾಗ್ನ್ಯಾಕ್ನಂತೆ ಪ್ರಬುದ್ಧರಾದರು. ಒಂದು ದಿನ ನಮ್ಮ ನರಮಂಡಲಗಳು ಗುರುತಿಸುವಿಕೆಯಲ್ಲಿ ಅತ್ಯುತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ತೋರಿಸುತ್ತವೆ ಎಂದು ನಾವು ಅರಿತುಕೊಂಡೆವು ಮತ್ತು ಅವುಗಳನ್ನು ಒಂದೇ b2b ಉತ್ಪನ್ನವಾಗಿ ಸಂಯೋಜಿಸಲು ನಾವು ನಿರ್ಧರಿಸಿದ್ದೇವೆ - ವಿಷನ್ - ನಾವು ಈಗ ನಾವೇ ಬಳಸುತ್ತೇವೆ ಮತ್ತು ನಿಮಗೆ ಬಳಸಲು ನೀಡುತ್ತೇವೆ.

ಇಂದು, Mail.Ru ಕ್ಲೌಡ್ ಸೊಲ್ಯೂಷನ್ಸ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ನಲ್ಲಿನ ನಮ್ಮ ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ತಂತ್ರಜ್ಞಾನವು ಯಶಸ್ವಿಯಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿದೆ ಮತ್ತು ಅತ್ಯಂತ ಸಂಕೀರ್ಣವಾದ ಪ್ರಾಯೋಗಿಕ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುತ್ತಿದೆ. ಇದು ನಮ್ಮ ಡೇಟಾ ಸೆಟ್‌ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದಿರುವ ಮತ್ತು ಅನ್ವಯಿಕ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುವಲ್ಲಿ ಪರಿಣತಿ ಹೊಂದಿರುವ ಹಲವಾರು ನರಗಳ ನೆಟ್‌ವರ್ಕ್‌ಗಳನ್ನು ಆಧರಿಸಿದೆ. ಎಲ್ಲಾ ಸೇವೆಗಳು ನಮ್ಮ ಸರ್ವರ್ ಸೌಲಭ್ಯಗಳಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ. ನಿಮ್ಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ ಸಾರ್ವಜನಿಕ ವಿಷನ್ API ಅನ್ನು ನೀವು ಸಂಯೋಜಿಸಬಹುದು, ಅದರ ಮೂಲಕ ಸೇವೆಯ ಎಲ್ಲಾ ಸಾಮರ್ಥ್ಯಗಳು ಲಭ್ಯವಿದೆ. API ವೇಗವಾಗಿದೆ - ಸರ್ವರ್ GPU ಗಳಿಗೆ ಧನ್ಯವಾದಗಳು, ನಮ್ಮ ನೆಟ್‌ವರ್ಕ್‌ನಲ್ಲಿ ಸರಾಸರಿ ಪ್ರತಿಕ್ರಿಯೆ ಸಮಯ 100 ms ಆಗಿದೆ.

ಬೆಕ್ಕಿಗೆ ಹೋಗಿ, ವಿವರವಾದ ಕಥೆ ಮತ್ತು ವಿಷನ್ ಕೆಲಸದ ಅನೇಕ ಉದಾಹರಣೆಗಳಿವೆ.

ಉಲ್ಲೇಖಿಸಲಾದ ಮುಖ ಗುರುತಿಸುವಿಕೆ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ನಾವೇ ಬಳಸುವ ಸೇವೆಯ ಉದಾಹರಣೆ ಕ್ರಿಯೆಗಳು. ಅದರ ಒಂದು ಅಂಶವೆಂದರೆ ವಿಷನ್ ಫೋಟೋ ಸ್ಟ್ಯಾಂಡ್, ಇದನ್ನು ನಾವು ವಿವಿಧ ಸಮ್ಮೇಳನಗಳಲ್ಲಿ ಸ್ಥಾಪಿಸುತ್ತೇವೆ. ನೀವು ಅಂತಹ ಫೋಟೋ ಸ್ಟ್ಯಾಂಡ್ ಅನ್ನು ಸಂಪರ್ಕಿಸಿದರೆ, ಅಂತರ್ನಿರ್ಮಿತ ಕ್ಯಾಮೆರಾದೊಂದಿಗೆ ಫೋಟೋ ತೆಗೆದುಕೊಂಡು ನಿಮ್ಮ ಇಮೇಲ್ ಅನ್ನು ನಮೂದಿಸಿದರೆ, ಸಮ್ಮೇಳನದ ಸಿಬ್ಬಂದಿ ಛಾಯಾಗ್ರಾಹಕರಿಂದ ನೀವು ಸೆರೆಹಿಡಿಯಲಾದ ಛಾಯಾಚಿತ್ರಗಳ ಶ್ರೇಣಿಯನ್ನು ಸಿಸ್ಟಮ್ ತಕ್ಷಣವೇ ಕಂಡುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಬಯಸಿದಲ್ಲಿ, ಕಂಡುಬಂದ ಛಾಯಾಚಿತ್ರಗಳನ್ನು ಇಮೇಲ್ ಮೂಲಕ ನಿಮಗೆ ಕಳುಹಿಸುತ್ತದೆ. ಮತ್ತು ನಾವು ಪ್ರದರ್ಶಿಸಿದ ಭಾವಚಿತ್ರದ ಚಿತ್ರಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುವುದಿಲ್ಲ - ಸಂದರ್ಶಕರ ಗುಂಪಿನಲ್ಲಿಯೂ ಸಹ ದೃಷ್ಟಿ ನಿಮ್ಮನ್ನು ಗುರುತಿಸುತ್ತದೆ. ಸಹಜವಾಗಿ, ಇದು ಗುರುತಿಸಲ್ಪಟ್ಟ ಫೋಟೋ ಸ್ಟ್ಯಾಂಡ್‌ಗಳಲ್ಲ, ಇವುಗಳು ಸುಂದರವಾದ ಸ್ಟ್ಯಾಂಡ್‌ಗಳಲ್ಲಿನ ಟ್ಯಾಬ್ಲೆಟ್‌ಗಳಾಗಿವೆ, ಅದು ಅತಿಥಿಗಳ ಅಂತರ್ನಿರ್ಮಿತ ಕ್ಯಾಮೆರಾಗಳೊಂದಿಗೆ ಸರಳವಾಗಿ ಫೋಟೋಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಮಾಹಿತಿಯನ್ನು ಸರ್ವರ್‌ಗಳಿಗೆ ರವಾನಿಸುತ್ತದೆ, ಅಲ್ಲಿ ಎಲ್ಲಾ ಗುರುತಿಸುವಿಕೆ ಮ್ಯಾಜಿಕ್ ಸಂಭವಿಸುತ್ತದೆ. ಮತ್ತು ಇಮೇಜ್ ಗುರುತಿಸುವಿಕೆ ತಜ್ಞರಲ್ಲಿ ತಂತ್ರಜ್ಞಾನದ ಪರಿಣಾಮಕಾರಿತ್ವವು ಎಷ್ಟು ಆಶ್ಚರ್ಯಕರವಾಗಿದೆ ಎಂಬುದನ್ನು ನಾವು ಒಂದಕ್ಕಿಂತ ಹೆಚ್ಚು ಬಾರಿ ನೋಡಿದ್ದೇವೆ. ಕೆಳಗೆ ನಾವು ಕೆಲವು ಉದಾಹರಣೆಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತೇವೆ.

1. ನಮ್ಮ ಮುಖ ಗುರುತಿಸುವಿಕೆ ಮಾದರಿ

1.1. ನರಮಂಡಲ ಮತ್ತು ಸಂಸ್ಕರಣಾ ವೇಗ

ಗುರುತಿಸುವಿಕೆಗಾಗಿ, ನಾವು ResNet 101 ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ಮಾದರಿಯ ಮಾರ್ಪಾಡುಗಳನ್ನು ಬಳಸುತ್ತೇವೆ. ಕೊನೆಯಲ್ಲಿ ಸರಾಸರಿ ಪೂಲಿಂಗ್ ಅನ್ನು ಆರ್ಕ್‌ಫೇಸ್‌ನಲ್ಲಿ ಹೇಗೆ ಮಾಡಲಾಗುತ್ತದೆ ಎಂಬುದರಂತೆಯೇ ಸಂಪೂರ್ಣವಾಗಿ ಸಂಪರ್ಕಿತ ಲೇಯರ್‌ನಿಂದ ಬದಲಾಯಿಸಲಾಗುತ್ತದೆ. ಆದಾಗ್ಯೂ, ವೆಕ್ಟರ್ ಪ್ರಾತಿನಿಧ್ಯಗಳ ಗಾತ್ರವು 128 ಆಗಿದೆ, 512 ಅಲ್ಲ. ನಮ್ಮ ತರಬೇತಿ ಸೆಟ್ 10 ಜನರ ಸುಮಾರು 273 ಮಿಲಿಯನ್ ಫೋಟೋಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.

ಎಚ್ಚರಿಕೆಯಿಂದ ಆಯ್ಕೆಮಾಡಿದ ಸರ್ವರ್ ಕಾನ್ಫಿಗರೇಶನ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಮತ್ತು ಜಿಪಿಯು ಕಂಪ್ಯೂಟಿಂಗ್‌ನಿಂದಾಗಿ ಮಾದರಿಯು ತ್ವರಿತವಾಗಿ ಚಲಿಸುತ್ತದೆ. ನಮ್ಮ ಆಂತರಿಕ ನೆಟ್‌ವರ್ಕ್‌ಗಳಲ್ಲಿ API ನಿಂದ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಸ್ವೀಕರಿಸಲು ಇದು 100 ms ನಿಂದ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ - ಇದು ಮುಖ ಪತ್ತೆ (ಫೋಟೋದಲ್ಲಿ ಮುಖವನ್ನು ಪತ್ತೆಹಚ್ಚುವುದು), API ಪ್ರತಿಕ್ರಿಯೆಯಲ್ಲಿ PersonID ಅನ್ನು ಗುರುತಿಸುವುದು ಮತ್ತು ಹಿಂತಿರುಗಿಸುವುದನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಒಳಬರುವ ಡೇಟಾದೊಂದಿಗೆ - ಫೋಟೋಗಳು ಮತ್ತು ವೀಡಿಯೊಗಳು - ಡೇಟಾವನ್ನು ಸೇವೆಗೆ ವರ್ಗಾಯಿಸಲು ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಸ್ವೀಕರಿಸಲು ಹೆಚ್ಚು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.

1.2. ಮಾದರಿಯ ಪರಿಣಾಮಕಾರಿತ್ವವನ್ನು ನಿರ್ಣಯಿಸುವುದು

ಆದರೆ ನರಮಂಡಲದ ದಕ್ಷತೆಯನ್ನು ನಿರ್ಧರಿಸುವುದು ಬಹಳ ಅಸ್ಪಷ್ಟ ಕಾರ್ಯವಾಗಿದೆ. ಅವರ ಕೆಲಸದ ಗುಣಮಟ್ಟವು ಮಾದರಿಗಳು ಯಾವ ಡೇಟಾ ಸೆಟ್‌ಗಳ ಮೇಲೆ ತರಬೇತಿ ಪಡೆದಿವೆ ಮತ್ತು ನಿರ್ದಿಷ್ಟ ಡೇಟಾದೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಅವುಗಳನ್ನು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾಗಿದೆಯೇ ಎಂಬುದರ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ.

ಜನಪ್ರಿಯ LFW ಪರಿಶೀಲನೆ ಪರೀಕ್ಷೆಯೊಂದಿಗೆ ನಾವು ನಮ್ಮ ಮಾದರಿಯ ನಿಖರತೆಯನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಪ್ರಾರಂಭಿಸಿದ್ದೇವೆ, ಆದರೆ ಇದು ತುಂಬಾ ಚಿಕ್ಕದಾಗಿದೆ ಮತ್ತು ಸರಳವಾಗಿದೆ. 99,8% ನಿಖರತೆಯನ್ನು ತಲುಪಿದ ನಂತರ, ಅದು ಇನ್ನು ಮುಂದೆ ಉಪಯುಕ್ತವಾಗುವುದಿಲ್ಲ. ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಉತ್ತಮ ಸ್ಪರ್ಧೆಯಿದೆ - ಮೆಗಾಫೇಸ್, ಅದರ ಮೇಲೆ ನಾವು ಕ್ರಮೇಣ 82% ರ್ಯಾಂಕ್ 1 ಅನ್ನು ತಲುಪಿದ್ದೇವೆ. ಮೆಗಾಫೇಸ್ ಪರೀಕ್ಷೆಯು ಮಿಲಿಯನ್ ಛಾಯಾಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ - ಡಿಸ್ಟ್ರಾಕ್ಟರ್‌ಗಳು - ಮತ್ತು ಮಾದರಿಯು ಫೇಸ್‌ಸ್ಕ್ರಬ್‌ನಿಂದ ಸೆಲೆಬ್ರಿಟಿಗಳ ಹಲವಾರು ಸಾವಿರ ಛಾಯಾಚಿತ್ರಗಳನ್ನು ಚೆನ್ನಾಗಿ ಗುರುತಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಡಿಸ್ಟ್ರಾಕ್ಟರ್‌ಗಳಿಂದ ಡೇಟಾಸೆಟ್. ಆದಾಗ್ಯೂ, ದೋಷಗಳ ಮೆಗಾಫೇಸ್ ಪರೀಕ್ಷೆಯನ್ನು ತೆರವುಗೊಳಿಸಿದ ನಂತರ, ತೆರವುಗೊಳಿಸಿದ ಆವೃತ್ತಿಯೊಂದಿಗೆ ನಾವು 98% ಶ್ರೇಣಿ 1 ರ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸುತ್ತೇವೆ ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ (ಸೆಲೆಬ್ರಿಟಿಗಳ ಫೋಟೋಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಸಾಕಷ್ಟು ನಿರ್ದಿಷ್ಟವಾಗಿರುತ್ತವೆ). ಆದ್ದರಿಂದ, ಅವರು ಮೆಗಾಫೇಸ್ನಂತೆಯೇ ಪ್ರತ್ಯೇಕ ಗುರುತಿನ ಪರೀಕ್ಷೆಯನ್ನು ರಚಿಸಿದರು, ಆದರೆ "ಸಾಮಾನ್ಯ" ಜನರ ಛಾಯಾಚಿತ್ರಗಳೊಂದಿಗೆ. ನಂತರ ನಾವು ನಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗಳಲ್ಲಿ ಗುರುತಿಸುವಿಕೆಯ ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸಿದ್ದೇವೆ ಮತ್ತು ಬಹಳ ಮುಂದೆ ಹೋಗಿದ್ದೇವೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ನಾವು ಹಲವಾರು ಸಾವಿರ ಫೋಟೋಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಕ್ಲಸ್ಟರಿಂಗ್ ಗುಣಮಟ್ಟದ ಪರೀಕ್ಷೆಯನ್ನು ಬಳಸುತ್ತೇವೆ; ಇದು ಬಳಕೆದಾರರ ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಫೇಸ್ ಟ್ಯಾಗಿಂಗ್ ಅನ್ನು ಅನುಕರಿಸುತ್ತದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಕ್ಲಸ್ಟರ್‌ಗಳು ಒಂದೇ ರೀತಿಯ ವ್ಯಕ್ತಿಗಳ ಗುಂಪುಗಳಾಗಿವೆ, ಪ್ರತಿ ಗುರುತಿಸಬಹುದಾದ ವ್ಯಕ್ತಿಗೆ ಒಂದು ಗುಂಪು. ನಾವು ನೈಜ ಗುಂಪುಗಳಲ್ಲಿ ಕೆಲಸದ ಗುಣಮಟ್ಟವನ್ನು ಪರಿಶೀಲಿಸಿದ್ದೇವೆ (ನಿಜ).

ಸಹಜವಾಗಿ, ಯಾವುದೇ ಮಾದರಿಯೊಂದಿಗೆ ಗುರುತಿಸುವಿಕೆ ದೋಷಗಳು ಸಂಭವಿಸುತ್ತವೆ. ಆದರೆ ಅಂತಹ ಸಂದರ್ಭಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ಪರಿಸ್ಥಿತಿಗಳಿಗಾಗಿ ಮಿತಿಗಳನ್ನು ಉತ್ತಮವಾಗಿ-ಟ್ಯೂನ್ ಮಾಡುವ ಮೂಲಕ ಪರಿಹರಿಸಲಾಗುತ್ತದೆ (ಎಲ್ಲಾ ಸಮ್ಮೇಳನಗಳಿಗೆ ನಾವು ಒಂದೇ ಮಿತಿಗಳನ್ನು ಬಳಸುತ್ತೇವೆ, ಆದರೆ, ಉದಾಹರಣೆಗೆ, ಪ್ರವೇಶ ನಿಯಂತ್ರಣ ವ್ಯವಸ್ಥೆಗಳಿಗಾಗಿ ನಾವು ಮಿತಿಗಳನ್ನು ಹೆಚ್ಚು ಹೆಚ್ಚಿಸಬೇಕು ಇದರಿಂದ ಕಡಿಮೆ ತಪ್ಪು ಧನಾತ್ಮಕತೆಗಳಿವೆ). ಹೆಚ್ಚಿನ ಕಾನ್ಫರೆನ್ಸ್ ಸಂದರ್ಶಕರನ್ನು ನಮ್ಮ ವಿಷನ್ ಫೋಟೋ ಬೂತ್‌ಗಳು ಸರಿಯಾಗಿ ಗುರುತಿಸಿವೆ. ಕೆಲವೊಮ್ಮೆ ಯಾರಾದರೂ ಕತ್ತರಿಸಿದ ಪೂರ್ವವೀಕ್ಷಣೆಯನ್ನು ನೋಡುತ್ತಾರೆ ಮತ್ತು "ನಿಮ್ಮ ಸಿಸ್ಟಮ್ ತಪ್ಪು ಮಾಡಿದೆ, ಅದು ನಾನಲ್ಲ." ನಂತರ ನಾವು ಫೋಟೋವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ತೆರೆದಿದ್ದೇವೆ ಮತ್ತು ಫೋಟೋದಲ್ಲಿ ನಿಜವಾಗಿಯೂ ಈ ಸಂದರ್ಶಕನಿದ್ದಾನೆ ಎಂದು ಅದು ಬದಲಾಯಿತು, ನಾವು ಮಾತ್ರ ಅವನನ್ನು ಛಾಯಾಚಿತ್ರ ಮಾಡುತ್ತಿಲ್ಲ, ಆದರೆ ಬೇರೊಬ್ಬರು, ವ್ಯಕ್ತಿಯು ಮಸುಕು ವಲಯದಲ್ಲಿ ಹಿನ್ನೆಲೆಯಲ್ಲಿ ಸಂಭವಿಸಿದ. ಇದಲ್ಲದೆ, ಮುಖದ ಭಾಗವು ಗೋಚರಿಸದಿದ್ದಾಗ ಅಥವಾ ವ್ಯಕ್ತಿಯು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ ನಿಂತಿರುವಾಗ ಅಥವಾ ಅರ್ಧ-ತಿರುಗಿರುವಾಗಲೂ ನರಗಳ ಜಾಲವು ಸರಿಯಾಗಿ ಗುರುತಿಸುತ್ತದೆ. ವೈಡ್-ಆಂಗಲ್ ಲೆನ್ಸ್‌ನೊಂದಿಗೆ ಶೂಟ್ ಮಾಡುವಾಗ ಮುಖವು ಆಪ್ಟಿಕಲ್ ಅಸ್ಪಷ್ಟತೆಯ ಪ್ರದೇಶದಲ್ಲಿದ್ದರೂ ಸಹ ಸಿಸ್ಟಮ್ ವ್ಯಕ್ತಿಯನ್ನು ಗುರುತಿಸಬಹುದು.

1.3. ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳಲ್ಲಿ ಪರೀಕ್ಷೆಯ ಉದಾಹರಣೆಗಳು

ನಮ್ಮ ನರಮಂಡಲವು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದರ ಉದಾಹರಣೆಗಳನ್ನು ಕೆಳಗೆ ನೀಡಲಾಗಿದೆ. ಫೋಟೋಗಳನ್ನು ಇನ್‌ಪುಟ್‌ಗೆ ಸಲ್ಲಿಸಲಾಗುತ್ತದೆ, ಅದನ್ನು ಅವಳು ವ್ಯಕ್ತಿ ಐಡಿ ಬಳಸಿ ಲೇಬಲ್ ಮಾಡಬೇಕು - ವ್ಯಕ್ತಿಯ ಅನನ್ಯ ಗುರುತಿಸುವಿಕೆ. ಎರಡು ಅಥವಾ ಹೆಚ್ಚಿನ ಚಿತ್ರಗಳು ಒಂದೇ ID ಹೊಂದಿದ್ದರೆ, ನಂತರ, ಮಾದರಿಗಳ ಪ್ರಕಾರ, ಈ ಫೋಟೋಗಳು ಒಂದೇ ವ್ಯಕ್ತಿಯನ್ನು ಚಿತ್ರಿಸುತ್ತದೆ.

ಪರೀಕ್ಷಿಸುವಾಗ, ನಿರ್ದಿಷ್ಟ ಫಲಿತಾಂಶವನ್ನು ಸಾಧಿಸಲು ನಾವು ಕಾನ್ಫಿಗರ್ ಮಾಡಬಹುದಾದ ವಿವಿಧ ನಿಯತಾಂಕಗಳು ಮತ್ತು ಮಾದರಿ ಮಿತಿಗಳಿಗೆ ನಾವು ಪ್ರವೇಶವನ್ನು ಹೊಂದಿದ್ದೇವೆ ಎಂದು ನಾವು ತಕ್ಷಣ ಗಮನಿಸೋಣ. ಸಾಮಾನ್ಯ ಪ್ರಕರಣಗಳಲ್ಲಿ ಗರಿಷ್ಠ ನಿಖರತೆಗಾಗಿ ಸಾರ್ವಜನಿಕ API ಅನ್ನು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾಗಿದೆ.

ಮುಂಭಾಗದ ಮುಖ ಗುರುತಿಸುವಿಕೆಯೊಂದಿಗೆ ಸರಳವಾದ ವಿಷಯದೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸೋಣ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಸರಿ, ಅದು ತುಂಬಾ ಸುಲಭವಾಗಿತ್ತು. ಕಾರ್ಯವನ್ನು ಸಂಕೀರ್ಣಗೊಳಿಸೋಣ, ಗಡ್ಡ ಮತ್ತು ಬೆರಳೆಣಿಕೆಯಷ್ಟು ವರ್ಷಗಳನ್ನು ಸೇರಿಸಿ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಇದು ತುಂಬಾ ಕಷ್ಟಕರವಲ್ಲ ಎಂದು ಕೆಲವರು ಹೇಳುತ್ತಾರೆ, ಏಕೆಂದರೆ ಎರಡೂ ಸಂದರ್ಭಗಳಲ್ಲಿ ಸಂಪೂರ್ಣ ಮುಖವು ಗೋಚರಿಸುತ್ತದೆ ಮತ್ತು ಅಲ್ಗಾರಿದಮ್‌ಗೆ ಮುಖದ ಬಗ್ಗೆ ಸಾಕಷ್ಟು ಮಾಹಿತಿ ಲಭ್ಯವಿದೆ. ಸರಿ, ಟಾಮ್ ಹಾರ್ಡಿಯನ್ನು ಪ್ರೊಫೈಲ್ ಆಗಿ ಪರಿವರ್ತಿಸೋಣ. ಈ ಸಮಸ್ಯೆಯು ಹೆಚ್ಚು ಜಟಿಲವಾಗಿದೆ ಮತ್ತು ಕಡಿಮೆ ದೋಷದ ಪ್ರಮಾಣವನ್ನು ಉಳಿಸಿಕೊಂಡು ಅದನ್ನು ಯಶಸ್ವಿಯಾಗಿ ಪರಿಹರಿಸಲು ನಾವು ಸಾಕಷ್ಟು ಪ್ರಯತ್ನಗಳನ್ನು ಮಾಡಿದ್ದೇವೆ: ನಾವು ತರಬೇತಿ ಸೆಟ್ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಿದ್ದೇವೆ, ನರಮಂಡಲದ ಆರ್ಕಿಟೆಕ್ಚರ್ ಮೂಲಕ ಯೋಚಿಸಿದ್ದೇವೆ, ನಷ್ಟದ ಕಾರ್ಯಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ ಮತ್ತು ಪೂರ್ವ-ಸಂಸ್ಕರಣೆಯನ್ನು ಸುಧಾರಿಸಿದ್ದೇವೆ. ಛಾಯಾಚಿತ್ರಗಳ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಅವನಿಗೆ ಶಿರಸ್ತ್ರಾಣವನ್ನು ಹಾಕೋಣ:

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಮೂಲಕ, ಇದು ವಿಶೇಷವಾಗಿ ಕಷ್ಟಕರವಾದ ಪರಿಸ್ಥಿತಿಯ ಉದಾಹರಣೆಯಾಗಿದೆ, ಏಕೆಂದರೆ ಮುಖವು ಹೆಚ್ಚು ಅಸ್ಪಷ್ಟವಾಗಿದೆ, ಮತ್ತು ಕೆಳಗಿನ ಫೋಟೋದಲ್ಲಿ ಕಣ್ಣುಗಳನ್ನು ಮರೆಮಾಡುವ ಆಳವಾದ ನೆರಳು ಕೂಡ ಇದೆ. ನಿಜ ಜೀವನದಲ್ಲಿ, ಜನರು ಆಗಾಗ್ಗೆ ಕಪ್ಪು ಕನ್ನಡಕಗಳ ಸಹಾಯದಿಂದ ತಮ್ಮ ನೋಟವನ್ನು ಬದಲಾಯಿಸುತ್ತಾರೆ. ಟಾಮ್ನೊಂದಿಗೆ ಅದೇ ರೀತಿ ಮಾಡೋಣ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಸರಿ, ವಿವಿಧ ವಯಸ್ಸಿನ ಫೋಟೋಗಳನ್ನು ಎಸೆಯಲು ಪ್ರಯತ್ನಿಸೋಣ ಮತ್ತು ಈ ಬಾರಿ ನಾವು ಬೇರೆ ನಟನೊಂದಿಗೆ ಪ್ರಯೋಗ ಮಾಡುತ್ತೇವೆ. ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ಉದಾಹರಣೆಯನ್ನು ತೆಗೆದುಕೊಳ್ಳೋಣ, ಅಲ್ಲಿ ವಯಸ್ಸಿಗೆ ಸಂಬಂಧಿಸಿದ ಬದಲಾವಣೆಗಳನ್ನು ವಿಶೇಷವಾಗಿ ಉಚ್ಚರಿಸಲಾಗುತ್ತದೆ. ಪರಿಸ್ಥಿತಿಯು ದೂರವಿಲ್ಲ; ನೀವು ಪಾಸ್‌ಪೋರ್ಟ್‌ನಲ್ಲಿರುವ ಫೋಟೋವನ್ನು ಹೊಂದಿರುವವರ ಮುಖದೊಂದಿಗೆ ಹೋಲಿಸಬೇಕಾದಾಗ ಇದು ಆಗಾಗ್ಗೆ ಸಂಭವಿಸುತ್ತದೆ. ಎಲ್ಲಾ ನಂತರ, ಮಾಲೀಕರು 20 ವರ್ಷ ವಯಸ್ಸಿನವರಾಗಿದ್ದಾಗ ಮೊದಲ ಛಾಯಾಚಿತ್ರವನ್ನು ಪಾಸ್‌ಪೋರ್ಟ್‌ಗೆ ಸೇರಿಸಲಾಗುತ್ತದೆ ಮತ್ತು 45 ನೇ ವಯಸ್ಸಿನಲ್ಲಿ ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಹೆಚ್ಚು ಬದಲಾಗಬಹುದು:

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಅಸಾಧ್ಯ ಕಾರ್ಯಾಚರಣೆಗಳ ಮುಖ್ಯ ತಜ್ಞರು ವಯಸ್ಸಿನೊಂದಿಗೆ ಹೆಚ್ಚು ಬದಲಾಗಿಲ್ಲ ಎಂದು ನೀವು ಭಾವಿಸುತ್ತೀರಾ? ಕೆಲವು ಜನರು ಸಹ ಮೇಲಿನ ಮತ್ತು ಕೆಳಗಿನ ಫೋಟೋಗಳನ್ನು ಸಂಯೋಜಿಸುತ್ತಾರೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ, ಹುಡುಗನು ವರ್ಷಗಳಲ್ಲಿ ತುಂಬಾ ಬದಲಾಗಿದ್ದಾನೆ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ನರಮಂಡಲಗಳು ಹೆಚ್ಚಾಗಿ ಕಾಣಿಸಿಕೊಳ್ಳುವಲ್ಲಿ ಬದಲಾವಣೆಗಳನ್ನು ಎದುರಿಸುತ್ತವೆ. ಉದಾಹರಣೆಗೆ, ಕೆಲವೊಮ್ಮೆ ಮಹಿಳೆಯರು ಸೌಂದರ್ಯವರ್ಧಕಗಳ ಸಹಾಯದಿಂದ ತಮ್ಮ ಚಿತ್ರವನ್ನು ಬಹಳವಾಗಿ ಬದಲಾಯಿಸಬಹುದು:

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಈಗ ಕಾರ್ಯವನ್ನು ಇನ್ನಷ್ಟು ಸಂಕೀರ್ಣಗೊಳಿಸೋಣ: ಮುಖದ ವಿವಿಧ ಭಾಗಗಳನ್ನು ವಿವಿಧ ಛಾಯಾಚಿತ್ರಗಳಲ್ಲಿ ಮುಚ್ಚಲಾಗಿದೆ ಎಂದು ಭಾವಿಸೋಣ. ಅಂತಹ ಸಂದರ್ಭಗಳಲ್ಲಿ, ಅಲ್ಗಾರಿದಮ್ ಸಂಪೂರ್ಣ ಮಾದರಿಗಳನ್ನು ಹೋಲಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಆದಾಗ್ಯೂ, ವಿಷನ್ ಈ ರೀತಿಯ ಸಂದರ್ಭಗಳನ್ನು ಚೆನ್ನಾಗಿ ನಿಭಾಯಿಸುತ್ತದೆ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಮೂಲಕ, ಛಾಯಾಚಿತ್ರದಲ್ಲಿ ಬಹಳಷ್ಟು ಮುಖಗಳು ಇರಬಹುದು; ಉದಾಹರಣೆಗೆ, ಸಭಾಂಗಣದ ಸಾಮಾನ್ಯ ಛಾಯಾಚಿತ್ರದಲ್ಲಿ 100 ಕ್ಕೂ ಹೆಚ್ಚು ಜನರು ಹೊಂದಿಕೊಳ್ಳಬಹುದು. ಇದು ನರಗಳ ಜಾಲಗಳಿಗೆ ಕಷ್ಟಕರವಾದ ಪರಿಸ್ಥಿತಿಯಾಗಿದೆ, ಏಕೆಂದರೆ ಅನೇಕ ಮುಖಗಳನ್ನು ವಿಭಿನ್ನವಾಗಿ ಬೆಳಗಿಸಬಹುದು, ಕೆಲವು ಗಮನಹರಿಸುವುದಿಲ್ಲ. ಆದಾಗ್ಯೂ, ಫೋಟೋವನ್ನು ಸಾಕಷ್ಟು ರೆಸಲ್ಯೂಶನ್ ಮತ್ತು ಗುಣಮಟ್ಟದೊಂದಿಗೆ ತೆಗೆದರೆ (ಮುಖವನ್ನು ಆವರಿಸುವ ಪ್ರತಿ ಚೌಕಕ್ಕೆ ಕನಿಷ್ಠ 75 ಪಿಕ್ಸೆಲ್‌ಗಳು), ವಿಷನ್ ಅದನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಗುರುತಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಕಣ್ಗಾವಲು ಕ್ಯಾಮರಾಗಳಿಂದ ವರದಿ ಮಾಡಲಾದ ಛಾಯಾಚಿತ್ರಗಳು ಮತ್ತು ಚಿತ್ರಗಳ ವಿಶಿಷ್ಟತೆಯೆಂದರೆ, ಜನರು ಆಗಾಗ್ಗೆ ಮಸುಕಾಗುತ್ತಾರೆ ಏಕೆಂದರೆ ಅವರು ಗಮನಹರಿಸಲಿಲ್ಲ ಅಥವಾ ಆ ಕ್ಷಣದಲ್ಲಿ ಚಲಿಸುತ್ತಿದ್ದರು:

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಅಲ್ಲದೆ, ಬೆಳಕಿನ ತೀವ್ರತೆಯು ಚಿತ್ರದಿಂದ ಚಿತ್ರಕ್ಕೆ ಹೆಚ್ಚು ಬದಲಾಗಬಹುದು. ಇದು ಕೂಡ ಆಗಾಗ್ಗೆ ಎಡವಟ್ಟಾಗುತ್ತದೆ; ಹಲವು ಅಲ್ಗಾರಿದಮ್‌ಗಳು ತುಂಬಾ ಗಾಢವಾದ ಮತ್ತು ತುಂಬಾ ಹಗುರವಾದ ಚಿತ್ರಗಳನ್ನು ಸರಿಯಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಲು ಕಷ್ಟಪಡುತ್ತವೆ, ಅವುಗಳನ್ನು ನಿಖರವಾಗಿ ಹೊಂದಿಸುವುದನ್ನು ನಮೂದಿಸಬಾರದು. ಈ ಫಲಿತಾಂಶವನ್ನು ಸಾಧಿಸಲು ನೀವು ಮಿತಿಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ರೀತಿಯಲ್ಲಿ ಕಾನ್ಫಿಗರ್ ಮಾಡಬೇಕಾಗುತ್ತದೆ ಎಂದು ನಾನು ನಿಮಗೆ ನೆನಪಿಸುತ್ತೇನೆ; ಈ ವೈಶಿಷ್ಟ್ಯವು ಇನ್ನೂ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿಲ್ಲ. ನಾವು ಎಲ್ಲಾ ಕ್ಲೈಂಟ್‌ಗಳಿಗೆ ಒಂದೇ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ಬಳಸುತ್ತೇವೆ; ಇದು ಹೆಚ್ಚಿನ ಪ್ರಾಯೋಗಿಕ ಕಾರ್ಯಗಳಿಗೆ ಸೂಕ್ತವಾದ ಮಿತಿಗಳನ್ನು ಹೊಂದಿದೆ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ನಾವು ಇತ್ತೀಚೆಗೆ ಹೆಚ್ಚಿನ ನಿಖರತೆಯೊಂದಿಗೆ ಏಷ್ಯಾದ ಮುಖಗಳನ್ನು ಗುರುತಿಸುವ ಮಾದರಿಯ ಹೊಸ ಆವೃತ್ತಿಯನ್ನು ಹೊರತಂದಿದ್ದೇವೆ. ಇದು ಒಂದು ದೊಡ್ಡ ಸಮಸ್ಯೆಯಾಗಿತ್ತು, ಇದನ್ನು "ಯಂತ್ರ ಕಲಿಕೆ" (ಅಥವಾ "ನರ ಜಾಲ") ವರ್ಣಭೇದ ನೀತಿ ಎಂದೂ ಕರೆಯಲಾಗುತ್ತಿತ್ತು. ಯುರೋಪಿಯನ್ ಮತ್ತು ಅಮೇರಿಕನ್ ನರಮಂಡಲಗಳು ಕಕೇಶಿಯನ್ ಮುಖಗಳನ್ನು ಚೆನ್ನಾಗಿ ಗುರುತಿಸಿವೆ, ಆದರೆ ಮಂಗೋಲಾಯ್ಡ್ ಮತ್ತು ನೀಗ್ರೋಯಿಡ್ ಮುಖಗಳೊಂದಿಗೆ ಪರಿಸ್ಥಿತಿಯು ತುಂಬಾ ಕೆಟ್ಟದಾಗಿದೆ. ಬಹುಶಃ, ಚೀನಾದಲ್ಲಿ ಪರಿಸ್ಥಿತಿ ನಿಖರವಾಗಿ ವಿರುದ್ಧವಾಗಿತ್ತು. ಇದು ನಿರ್ದಿಷ್ಟ ದೇಶದ ಜನರ ಪ್ರಬಲ ಪ್ರಕಾರಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ತರಬೇತಿ ಡೇಟಾ ಸೆಟ್‌ಗಳ ಬಗ್ಗೆ ಅಷ್ಟೆ. ಆದಾಗ್ಯೂ, ಪರಿಸ್ಥಿತಿ ಬದಲಾಗುತ್ತಿದೆ; ಇಂದು ಈ ಸಮಸ್ಯೆ ಅಷ್ಟು ತೀವ್ರವಾಗಿಲ್ಲ. ವಿವಿಧ ಜನಾಂಗದ ಜನರೊಂದಿಗೆ ದೃಷ್ಟಿಗೆ ಯಾವುದೇ ತೊಂದರೆ ಇಲ್ಲ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಮುಖ ಗುರುತಿಸುವಿಕೆ ನಮ್ಮ ತಂತ್ರಜ್ಞಾನದ ಹಲವು ಅನ್ವಯಿಕೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ; ಯಾವುದನ್ನಾದರೂ ಗುರುತಿಸಲು ದೃಷ್ಟಿಗೆ ತರಬೇತಿ ನೀಡಬಹುದು. ಉದಾಹರಣೆಗೆ, ಅಲ್ಗಾರಿದಮ್‌ಗಳಿಗೆ ಕಷ್ಟಕರವಾದ ಪರಿಸ್ಥಿತಿಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಪರವಾನಗಿ ಫಲಕಗಳು: ತೀಕ್ಷ್ಣವಾದ ಕೋನಗಳಲ್ಲಿ, ಕೊಳಕು ಮತ್ತು ಪರವಾನಗಿ ಫಲಕಗಳನ್ನು ಓದಲು ಕಷ್ಟ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

2. ಪ್ರಾಯೋಗಿಕ ಬಳಕೆಯ ಪ್ರಕರಣಗಳು

2.1. ಭೌತಿಕ ಪ್ರವೇಶ ನಿಯಂತ್ರಣ: ಇಬ್ಬರು ಜನರು ಒಂದೇ ಪಾಸ್ ಅನ್ನು ಬಳಸಿದಾಗ

ವಿಷನ್ ಸಹಾಯದಿಂದ, ಉದ್ಯೋಗಿಗಳ ಆಗಮನ ಮತ್ತು ನಿರ್ಗಮನವನ್ನು ರೆಕಾರ್ಡ್ ಮಾಡಲು ನೀವು ವ್ಯವಸ್ಥೆಗಳನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಬಹುದು. ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಪಾಸ್ಗಳ ಆಧಾರದ ಮೇಲೆ ಸಾಂಪ್ರದಾಯಿಕ ವ್ಯವಸ್ಥೆಯು ಸ್ಪಷ್ಟ ಅನಾನುಕೂಲಗಳನ್ನು ಹೊಂದಿದೆ, ಉದಾಹರಣೆಗೆ, ನೀವು ಒಂದು ಬ್ಯಾಡ್ಜ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಎರಡು ಜನರನ್ನು ರವಾನಿಸಬಹುದು. ಪ್ರವೇಶ ನಿಯಂತ್ರಣ ವ್ಯವಸ್ಥೆಯು (ACS) ವಿಷನ್‌ನೊಂದಿಗೆ ಪೂರಕವಾಗಿದ್ದರೆ, ಯಾರು ಬಂದರು/ಬಿಟ್ಟರು ಮತ್ತು ಯಾವಾಗ ಎಂಬುದನ್ನು ಪ್ರಾಮಾಣಿಕವಾಗಿ ದಾಖಲಿಸುತ್ತದೆ.

2.2 ಸಮಯ ಟ್ರ್ಯಾಕಿಂಗ್

ಈ ವಿಷನ್ ಬಳಕೆಯ ಪ್ರಕರಣವು ಹಿಂದಿನದಕ್ಕೆ ನಿಕಟವಾಗಿ ಸಂಬಂಧಿಸಿದೆ. ನಮ್ಮ ಮುಖ ಗುರುತಿಸುವಿಕೆ ಸೇವೆಯೊಂದಿಗೆ ನೀವು ಪ್ರವೇಶ ವ್ಯವಸ್ಥೆಯನ್ನು ಪೂರಕಗೊಳಿಸಿದರೆ, ಪ್ರವೇಶ ನಿಯಂತ್ರಣ ಉಲ್ಲಂಘನೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮಾತ್ರವಲ್ಲದೆ ಕಟ್ಟಡ ಅಥವಾ ಸೌಲಭ್ಯದಲ್ಲಿ ಉದ್ಯೋಗಿಗಳ ನಿಜವಾದ ಉಪಸ್ಥಿತಿಯನ್ನು ನೋಂದಾಯಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ತನ್ನ ಸಹೋದ್ಯೋಗಿಗಳು ತನ್ನ ಮೇಲಧಿಕಾರಿಗಳ ಮುಂದೆ ತನಗಾಗಿ ಕವರ್ ಮಾಡಿದರೂ ಸಹ, ಯಾರು ಕೆಲಸಕ್ಕೆ ಬಂದರು ಮತ್ತು ಯಾವ ಸಮಯದಲ್ಲಿ ಹೋದರು ಮತ್ತು ಕೆಲಸವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಬಿಟ್ಟುಬಿಟ್ಟವರು ಯಾರು ಎಂದು ಪ್ರಾಮಾಣಿಕವಾಗಿ ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಲು ವಿಷನ್ ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

2.3 ವೀಡಿಯೊ ಅನಾಲಿಟಿಕ್ಸ್: ಜನರ ಟ್ರ್ಯಾಕಿಂಗ್ ಮತ್ತು ಭದ್ರತೆ

ವಿಷನ್ ಬಳಸಿಕೊಂಡು ಜನರನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುವ ಮೂಲಕ, ನೀವು ಶಾಪಿಂಗ್ ಪ್ರದೇಶಗಳು, ರೈಲು ನಿಲ್ದಾಣಗಳು, ಹಾದಿಗಳು, ಬೀದಿಗಳು ಮತ್ತು ಇತರ ಅನೇಕ ಸಾರ್ವಜನಿಕ ಸ್ಥಳಗಳ ನೈಜ ದಟ್ಟಣೆಯನ್ನು ನಿಖರವಾಗಿ ನಿರ್ಣಯಿಸಬಹುದು. ನಮ್ಮ ಟ್ರ್ಯಾಕಿಂಗ್ ಪ್ರವೇಶವನ್ನು ನಿಯಂತ್ರಿಸುವಲ್ಲಿ ಸಹ ಉತ್ತಮ ಸಹಾಯವಾಗಬಹುದು, ಉದಾಹರಣೆಗೆ, ಗೋದಾಮು ಅಥವಾ ಇತರ ಪ್ರಮುಖ ಕಚೇರಿ ಆವರಣಗಳಿಗೆ. ಮತ್ತು ಸಹಜವಾಗಿ, ಜನರು ಮತ್ತು ಮುಖಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡುವುದು ಭದ್ರತಾ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ನಿಮ್ಮ ಅಂಗಡಿಯಿಂದ ಯಾರಾದರೂ ಕಳ್ಳತನ ಮಾಡುತ್ತಿದ್ದಾರಾ? ನಿಮ್ಮ ವೀಡಿಯೋ ಅನಾಲಿಟಿಕ್ಸ್ ಸಾಫ್ಟ್‌ವೇರ್‌ನ ಕಪ್ಪುಪಟ್ಟಿಗೆ ವಿಷನ್ ಹಿಂತಿರುಗಿಸಿದ ಅವರ ಪರ್ಸನ್‌ಐಡಿ ಸೇರಿಸಿ ಮತ್ತು ಮುಂದಿನ ಬಾರಿ ಈ ಪ್ರಕಾರವು ಮತ್ತೆ ಕಾಣಿಸಿಕೊಂಡರೆ ಸಿಸ್ಟಂ ತಕ್ಷಣವೇ ಭದ್ರತೆಯನ್ನು ಎಚ್ಚರಿಸುತ್ತದೆ.

2.4 ವ್ಯಾಪಾರದಲ್ಲಿ

ಚಿಲ್ಲರೆ ವ್ಯಾಪಾರ ಮತ್ತು ವಿವಿಧ ಸೇವಾ ವ್ಯವಹಾರಗಳು ಕ್ಯೂ ಗುರುತಿಸುವಿಕೆಯಲ್ಲಿ ಆಸಕ್ತಿ ಹೊಂದಿವೆ. ವಿಷನ್ ಸಹಾಯದಿಂದ, ಇದು ಯಾದೃಚ್ಛಿಕ ಜನರ ಗುಂಪಲ್ಲ, ಆದರೆ ಕ್ಯೂ ಎಂದು ನೀವು ಗುರುತಿಸಬಹುದು ಮತ್ತು ಅದರ ಉದ್ದವನ್ನು ನಿರ್ಧರಿಸಬಹುದು. ತದನಂತರ ವ್ಯವಸ್ಥೆಯು ಸರದಿಯಲ್ಲಿರುವವರಿಗೆ ಸರದಿಯ ಬಗ್ಗೆ ತಿಳಿಸುತ್ತದೆ ಇದರಿಂದ ಅವರು ಪರಿಸ್ಥಿತಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಬಹುದು: ಒಂದೋ ಸಂದರ್ಶಕರ ಒಳಹರಿವು ಮತ್ತು ಹೆಚ್ಚುವರಿ ಕೆಲಸಗಾರರನ್ನು ಕರೆಯುವ ಅಗತ್ಯವಿದೆ, ಅಥವಾ ಯಾರಾದರೂ ತಮ್ಮ ಕೆಲಸದ ಕರ್ತವ್ಯಗಳನ್ನು ಸಡಿಲಗೊಳಿಸುತ್ತಿದ್ದಾರೆ.

ಸಂದರ್ಶಕರಿಂದ ಸಭಾಂಗಣದಲ್ಲಿ ಕಂಪನಿಯ ಉದ್ಯೋಗಿಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸುವುದು ಮತ್ತೊಂದು ಆಸಕ್ತಿದಾಯಕ ಕಾರ್ಯವಾಗಿದೆ. ವಿಶಿಷ್ಟವಾಗಿ, ಕೆಲವು ಬಟ್ಟೆಗಳನ್ನು (ಡ್ರೆಸ್ ಕೋಡ್) ಅಥವಾ ಕೆಲವು ವಿಶಿಷ್ಟ ವೈಶಿಷ್ಟ್ಯಗಳೊಂದಿಗೆ (ಬ್ರಾಂಡೆಡ್ ಸ್ಕಾರ್ಫ್, ಎದೆಯ ಮೇಲೆ ಬ್ಯಾಡ್ಜ್, ಇತ್ಯಾದಿ) ಧರಿಸಿರುವ ವಸ್ತುಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸಲು ಸಿಸ್ಟಮ್ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ. ಹಾಜರಾತಿಯನ್ನು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ನಿರ್ಣಯಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ (ಆದ್ದರಿಂದ ನೌಕರರು ತಮ್ಮ ಉಪಸ್ಥಿತಿಯಿಂದ ಸಭಾಂಗಣದಲ್ಲಿರುವ ಜನರ ಅಂಕಿಅಂಶಗಳನ್ನು "ಉಬ್ಬಿಕೊಳ್ಳುವುದಿಲ್ಲ").

ಮುಖದ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬಳಸಿಕೊಂಡು, ನಿಮ್ಮ ಪ್ರೇಕ್ಷಕರನ್ನು ನೀವು ಮೌಲ್ಯಮಾಪನ ಮಾಡಬಹುದು: ಸಂದರ್ಶಕರ ನಿಷ್ಠೆ ಏನು, ಅಂದರೆ, ಎಷ್ಟು ಜನರು ನಿಮ್ಮ ಸ್ಥಾಪನೆಗೆ ಮರಳುತ್ತಾರೆ ಮತ್ತು ಯಾವ ಆವರ್ತನದೊಂದಿಗೆ. ತಿಂಗಳಿಗೆ ನಿಮ್ಮ ಬಳಿಗೆ ಎಷ್ಟು ಅನನ್ಯ ಸಂದರ್ಶಕರು ಬರುತ್ತಾರೆ ಎಂಬುದನ್ನು ಲೆಕ್ಕ ಹಾಕಿ. ಆಕರ್ಷಣೆ ಮತ್ತು ಧಾರಣ ವೆಚ್ಚವನ್ನು ಅತ್ಯುತ್ತಮವಾಗಿಸಲು, ವಾರದ ದಿನ ಮತ್ತು ದಿನದ ಸಮಯವನ್ನು ಅವಲಂಬಿಸಿ ಸಂಚಾರದಲ್ಲಿನ ಬದಲಾವಣೆಯನ್ನು ಸಹ ನೀವು ಕಂಡುಹಿಡಿಯಬಹುದು.

ಫ್ರ್ಯಾಂಚೈಸರ್‌ಗಳು ಮತ್ತು ಸರಪಳಿ ಕಂಪನಿಗಳು ವಿವಿಧ ಚಿಲ್ಲರೆ ಮಾರಾಟ ಮಳಿಗೆಗಳ ಬ್ರ್ಯಾಂಡಿಂಗ್‌ನ ಗುಣಮಟ್ಟದ ಛಾಯಾಚಿತ್ರಗಳ ಆಧಾರದ ಮೇಲೆ ಮೌಲ್ಯಮಾಪನವನ್ನು ಆದೇಶಿಸಬಹುದು: ಲೋಗೊಗಳು, ಚಿಹ್ನೆಗಳು, ಪೋಸ್ಟರ್‌ಗಳು, ಬ್ಯಾನರ್‌ಗಳು ಇತ್ಯಾದಿಗಳ ಉಪಸ್ಥಿತಿ.

2.5 ಸಾರಿಗೆ ಮೂಲಕ

ವೀಡಿಯೋ ಅನಾಲಿಟಿಕ್ಸ್ ಬಳಸಿಕೊಂಡು ಭದ್ರತೆಯನ್ನು ಖಾತರಿಪಡಿಸುವ ಇನ್ನೊಂದು ಉದಾಹರಣೆಯೆಂದರೆ ವಿಮಾನ ನಿಲ್ದಾಣಗಳು ಅಥವಾ ರೈಲು ನಿಲ್ದಾಣಗಳ ಸಭಾಂಗಣಗಳಲ್ಲಿ ಕೈಬಿಟ್ಟ ವಸ್ತುಗಳನ್ನು ಗುರುತಿಸುವುದು. ನೂರಾರು ವರ್ಗಗಳ ವಸ್ತುಗಳನ್ನು ಗುರುತಿಸಲು ದೃಷ್ಟಿ ತರಬೇತಿ ನೀಡಬಹುದು: ಪೀಠೋಪಕರಣಗಳ ತುಣುಕುಗಳು, ಚೀಲಗಳು, ಸೂಟ್ಕೇಸ್ಗಳು, ಛತ್ರಿಗಳು, ವಿವಿಧ ರೀತಿಯ ಬಟ್ಟೆ, ಬಾಟಲಿಗಳು, ಇತ್ಯಾದಿ. ನಿಮ್ಮ ವೀಡಿಯೊ ವಿಶ್ಲೇಷಣಾ ವ್ಯವಸ್ಥೆಯು ಮಾಲೀಕರಿಲ್ಲದ ವಸ್ತುವನ್ನು ಪತ್ತೆಹಚ್ಚಿದರೆ ಮತ್ತು ವಿಷನ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಅದನ್ನು ಗುರುತಿಸಿದರೆ, ಅದು ಭದ್ರತಾ ಸೇವೆಗೆ ಸಂಕೇತವನ್ನು ಕಳುಹಿಸುತ್ತದೆ. ಸಾರ್ವಜನಿಕ ಸ್ಥಳಗಳಲ್ಲಿನ ಅಸಾಮಾನ್ಯ ಸಂದರ್ಭಗಳ ಸ್ವಯಂಚಾಲಿತ ಪತ್ತೆಗೆ ಇದೇ ರೀತಿಯ ಕಾರ್ಯವು ಸಂಬಂಧಿಸಿದೆ: ಯಾರಾದರೂ ಅನಾರೋಗ್ಯ ಅನುಭವಿಸುತ್ತಾರೆ, ಅಥವಾ ಯಾರಾದರೂ ತಪ್ಪಾದ ಸ್ಥಳದಲ್ಲಿ ಧೂಮಪಾನ ಮಾಡುತ್ತಾರೆ, ಅಥವಾ ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಹಳಿಗಳ ಮೇಲೆ ಬೀಳುತ್ತಾನೆ, ಮತ್ತು ಹೀಗೆ - ಈ ಎಲ್ಲಾ ಮಾದರಿಗಳನ್ನು ವೀಡಿಯೊ ವಿಶ್ಲೇಷಣಾ ವ್ಯವಸ್ಥೆಗಳಿಂದ ಗುರುತಿಸಬಹುದು. ವಿಷನ್ API ಮೂಲಕ.

2.6. ಡಾಕ್ಯುಮೆಂಟ್ ಹರಿವು

ನಾವು ಪ್ರಸ್ತುತ ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಿರುವ ವಿಷನ್‌ನ ಮತ್ತೊಂದು ಆಸಕ್ತಿದಾಯಕ ಭವಿಷ್ಯದ ಅಪ್ಲಿಕೇಶನ್ ಡಾಕ್ಯುಮೆಂಟ್ ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ಡೇಟಾಬೇಸ್‌ಗಳಾಗಿ ಅವುಗಳ ಸ್ವಯಂಚಾಲಿತ ಪಾರ್ಸಿಂಗ್ ಆಗಿದೆ. ಅಂತ್ಯವಿಲ್ಲದ ಸರಣಿಗಳು, ಸಂಖ್ಯೆಗಳು, ವಿತರಣೆಯ ದಿನಾಂಕಗಳು, ಖಾತೆ ಸಂಖ್ಯೆಗಳು, ಬ್ಯಾಂಕ್ ವಿವರಗಳು, ದಿನಾಂಕಗಳು ಮತ್ತು ಜನ್ಮ ಸ್ಥಳಗಳು ಮತ್ತು ಇತರ ಹಲವು ಔಪಚಾರಿಕ ಡೇಟಾವನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ನಮೂದಿಸುವ (ಅಥವಾ ಕೆಟ್ಟದಾಗಿ ನಮೂದಿಸುವ) ಬದಲಿಗೆ, ನೀವು ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಬಹುದು ಮತ್ತು ಅವುಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸುರಕ್ಷಿತ ಚಾನಲ್ ಮೂಲಕ ಕಳುಹಿಸಬಹುದು ಕ್ಲೌಡ್‌ಗೆ API, ಅಲ್ಲಿ ಸಿಸ್ಟಮ್ ಈ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಫ್ಲೈನಲ್ಲಿ ಗುರುತಿಸುತ್ತದೆ, ಅವುಗಳನ್ನು ಪಾರ್ಸ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಡೇಟಾಬೇಸ್‌ಗೆ ಸ್ವಯಂಚಾಲಿತ ಪ್ರವೇಶಕ್ಕಾಗಿ ಅಗತ್ಯವಿರುವ ಸ್ವರೂಪದಲ್ಲಿ ಡೇಟಾದೊಂದಿಗೆ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ಇಂದು ವಿಷನ್ ಈಗಾಗಲೇ ಡಾಕ್ಯುಮೆಂಟ್ಗಳನ್ನು (ಪಿಡಿಎಫ್ ಸೇರಿದಂತೆ) ಹೇಗೆ ವರ್ಗೀಕರಿಸಬೇಕೆಂದು ತಿಳಿದಿದೆ - ಪಾಸ್ಪೋರ್ಟ್ಗಳು, SNILS, TIN, ಜನ್ಮ ಪ್ರಮಾಣಪತ್ರಗಳು, ಮದುವೆ ಪ್ರಮಾಣಪತ್ರಗಳು ಮತ್ತು ಇತರವುಗಳ ನಡುವೆ ವ್ಯತ್ಯಾಸವನ್ನು ತೋರಿಸುತ್ತದೆ.

ಸಹಜವಾಗಿ, ಈ ಎಲ್ಲಾ ಸಂದರ್ಭಗಳನ್ನು ಪೆಟ್ಟಿಗೆಯಿಂದ ಹೊರಗೆ ನಿಭಾಯಿಸಲು ನರಮಂಡಲವು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ. ಪ್ರತಿಯೊಂದು ಸಂದರ್ಭದಲ್ಲಿ, ನಿರ್ದಿಷ್ಟ ಗ್ರಾಹಕರಿಗಾಗಿ ಹೊಸ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲಾಗಿದೆ, ಅನೇಕ ಅಂಶಗಳು, ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸಗಳು ಮತ್ತು ಅವಶ್ಯಕತೆಗಳನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಲಾಗುತ್ತದೆ, ಡೇಟಾ ಸೆಟ್ಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತದೆ ಮತ್ತು ತರಬೇತಿ, ಪರೀಕ್ಷೆ ಮತ್ತು ಸಂರಚನೆಯ ಪುನರಾವರ್ತನೆಗಳನ್ನು ಕೈಗೊಳ್ಳಲಾಗುತ್ತದೆ.

3. API ಕಾರ್ಯಾಚರಣೆ ಯೋಜನೆ

ಬಳಕೆದಾರರಿಗಾಗಿ ವಿಷನ್‌ನ "ಪ್ರವೇಶ ದ್ವಾರ" REST API ಆಗಿದೆ. ಇದು ಇನ್‌ಪುಟ್‌ನಂತೆ ನೆಟ್‌ವರ್ಕ್ ಕ್ಯಾಮೆರಾಗಳಿಂದ (RTSP ಸ್ಟ್ರೀಮ್‌ಗಳು) ಫೋಟೋಗಳು, ವೀಡಿಯೊ ಫೈಲ್‌ಗಳು ಮತ್ತು ಪ್ರಸಾರಗಳನ್ನು ಸ್ವೀಕರಿಸಬಹುದು.

ದೃಷ್ಟಿ ಬಳಸಲು, ನಿಮಗೆ ಅಗತ್ಯವಿದೆ ನೋಂದಣಿ Mail.ru Cloud Solutions ಸೇವೆಯಲ್ಲಿ ಮತ್ತು ಪ್ರವೇಶ ಟೋಕನ್‌ಗಳನ್ನು ಸ್ವೀಕರಿಸಿ (client_id + client_secret). OAuth ಪ್ರೋಟೋಕಾಲ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಬಳಕೆದಾರರ ದೃಢೀಕರಣವನ್ನು ನಡೆಸಲಾಗುತ್ತದೆ. POST ವಿನಂತಿಗಳಲ್ಲಿರುವ ಮೂಲ ಡೇಟಾವನ್ನು API ಗೆ ಕಳುಹಿಸಲಾಗುತ್ತದೆ. ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯಾಗಿ, ಕ್ಲೈಂಟ್ API ನಿಂದ JSON ಸ್ವರೂಪದಲ್ಲಿ ಗುರುತಿಸುವಿಕೆಯ ಫಲಿತಾಂಶವನ್ನು ಪಡೆಯುತ್ತದೆ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆಯು ರಚನೆಯಾಗಿದೆ: ಇದು ಕಂಡುಬರುವ ವಸ್ತುಗಳು ಮತ್ತು ಅವುಗಳ ನಿರ್ದೇಶಾಂಕಗಳ ಬಗ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ.

ಗಡ್ಡ, ಕಪ್ಪು ಕನ್ನಡಕ ಮತ್ತು ಪ್ರೊಫೈಲ್‌ನಲ್ಲಿ: ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿಗೆ ಕಷ್ಟಕರ ಸಂದರ್ಭಗಳು

ಮಾದರಿ ಉತ್ತರ

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

ಉತ್ತರವು ಆಸಕ್ತಿದಾಯಕ ಪ್ಯಾರಾಮೀಟರ್ ಅದ್ಭುತತೆಯನ್ನು ಒಳಗೊಂಡಿದೆ - ಇದು ಫೋಟೋದಲ್ಲಿನ ಮುಖದ ಷರತ್ತುಬದ್ಧ “ತಂಪು”, ಅದರ ಸಹಾಯದಿಂದ ನಾವು ಅನುಕ್ರಮದಿಂದ ಮುಖದ ಅತ್ಯುತ್ತಮ ಶಾಟ್ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡುತ್ತೇವೆ. ಸಾಮಾಜಿಕ ನೆಟ್‌ವರ್ಕ್‌ಗಳಲ್ಲಿ ಫೋಟೋ ಇಷ್ಟವಾಗುವ ಸಾಧ್ಯತೆಯನ್ನು ಊಹಿಸಲು ನಾವು ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗೆ ತರಬೇತಿ ನೀಡಿದ್ದೇವೆ. ಫೋಟೋದ ಗುಣಮಟ್ಟ ಉತ್ತಮವಾಗಿರುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚು ನಗುತ್ತಿರುವ ಮುಖವು ಅದ್ಭುತವಾಗಿದೆ.

API ವಿಷನ್ ಸ್ಪೇಸ್ ಎಂಬ ಪರಿಕಲ್ಪನೆಯನ್ನು ಬಳಸುತ್ತದೆ. ವಿಭಿನ್ನ ಮುಖಗಳನ್ನು ರಚಿಸಲು ಇದು ಒಂದು ಸಾಧನವಾಗಿದೆ. ಸ್ಥಳಗಳ ಉದಾಹರಣೆಗಳು ಕಪ್ಪು ಮತ್ತು ಬಿಳಿ ಪಟ್ಟಿಗಳು, ಸಂದರ್ಶಕರ ಪಟ್ಟಿಗಳು, ಉದ್ಯೋಗಿಗಳು, ಕ್ಲೈಂಟ್‌ಗಳು, ಇತ್ಯಾದಿ. ವಿಷನ್‌ನಲ್ಲಿ ಪ್ರತಿ ಟೋಕನ್‌ಗೆ, ನೀವು 10 ಸ್ಥಳಗಳನ್ನು ರಚಿಸಬಹುದು, ಪ್ರತಿ ಜಾಗವು 50 ಸಾವಿರ ಪರ್ಸನ್‌ಐಡಿಗಳನ್ನು ಹೊಂದಬಹುದು, ಅಂದರೆ, 500 ಸಾವಿರದವರೆಗೆ ಪ್ರತಿ ಟೋಕನ್. ಇದಲ್ಲದೆ, ಪ್ರತಿ ಖಾತೆಗೆ ಟೋಕನ್ಗಳ ಸಂಖ್ಯೆಯು ಸೀಮಿತವಾಗಿಲ್ಲ.

ಇಂದು API ಕೆಳಗಿನ ಪತ್ತೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆ ವಿಧಾನಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ:

  • ಗುರುತಿಸಿ/ಹೊಂದಿಸಿ - ಮುಖಗಳ ಪತ್ತೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆ. ಪ್ರತಿ ಅನನ್ಯ ವ್ಯಕ್ತಿಗೆ ಸ್ವಯಂಚಾಲಿತವಾಗಿ PersonID ಅನ್ನು ನಿಯೋಜಿಸುತ್ತದೆ, PersonID ಮತ್ತು ಪತ್ತೆಯಾದ ವ್ಯಕ್ತಿಗಳ ನಿರ್ದೇಶಾಂಕಗಳನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ.
  • ಅಳಿಸಿ - ವ್ಯಕ್ತಿಯ ಡೇಟಾಬೇಸ್‌ನಿಂದ ನಿರ್ದಿಷ್ಟ PersonID ಅನ್ನು ಅಳಿಸುವುದು.
  • ಮೊಟಕುಗೊಳಿಸಿ - PersonID ಯಿಂದ ಸಂಪೂರ್ಣ ಜಾಗವನ್ನು ತೆರವುಗೊಳಿಸುತ್ತದೆ, ಅದನ್ನು ಪರೀಕ್ಷಾ ಸ್ಥಳವಾಗಿ ಬಳಸಿದರೆ ಉಪಯುಕ್ತವಾಗಿದೆ ಮತ್ತು ಉತ್ಪಾದನೆಗಾಗಿ ನೀವು ಡೇಟಾಬೇಸ್ ಅನ್ನು ಮರುಹೊಂದಿಸಬೇಕಾದರೆ.
  • ಪತ್ತೆ - ವಸ್ತುಗಳು, ದೃಶ್ಯಗಳು, ಪರವಾನಗಿ ಫಲಕಗಳು, ಹೆಗ್ಗುರುತುಗಳು, ಸರತಿ ಸಾಲುಗಳು ಇತ್ಯಾದಿಗಳ ಪತ್ತೆ. ಕಂಡುಬರುವ ವಸ್ತುಗಳ ವರ್ಗ ಮತ್ತು ಅವುಗಳ ನಿರ್ದೇಶಾಂಕಗಳನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ
  • ದಾಖಲೆಗಳಿಗಾಗಿ ಪತ್ತೆ ಮಾಡಿ - ರಷ್ಯಾದ ಒಕ್ಕೂಟದ ನಿರ್ದಿಷ್ಟ ರೀತಿಯ ದಾಖಲೆಗಳನ್ನು ಪತ್ತೆ ಮಾಡುತ್ತದೆ (ಪಾಸ್ಪೋರ್ಟ್, SNILS, ತೆರಿಗೆ ಗುರುತಿನ ಸಂಖ್ಯೆ, ಇತ್ಯಾದಿಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸುತ್ತದೆ).

ನಾವು ಶೀಘ್ರದಲ್ಲೇ OCR, ಲಿಂಗ, ವಯಸ್ಸು ಮತ್ತು ಭಾವನೆಗಳನ್ನು ನಿರ್ಧರಿಸುವ ವಿಧಾನಗಳ ಕೆಲಸವನ್ನು ಪೂರ್ಣಗೊಳಿಸುತ್ತೇವೆ, ಜೊತೆಗೆ ವ್ಯಾಪಾರದ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸುತ್ತೇವೆ, ಅಂದರೆ, ಅಂಗಡಿಗಳಲ್ಲಿ ಸರಕುಗಳ ಪ್ರದರ್ಶನವನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿಯಂತ್ರಿಸುತ್ತೇವೆ. ನೀವು ಸಂಪೂರ್ಣ API ದಸ್ತಾವೇಜನ್ನು ಇಲ್ಲಿ ಕಾಣಬಹುದು: https://mcs.mail.ru/help/vision-api

4. ತೀರ್ಮಾನ

ಈಗ, ಸಾರ್ವಜನಿಕ API ಮೂಲಕ, ನೀವು ಫೋಟೋಗಳು ಮತ್ತು ವೀಡಿಯೊಗಳಲ್ಲಿ ಮುಖದ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಪ್ರವೇಶಿಸಬಹುದು; ವಿವಿಧ ವಸ್ತುಗಳು, ಪರವಾನಗಿ ಫಲಕಗಳು, ಹೆಗ್ಗುರುತುಗಳು, ದಾಖಲೆಗಳು ಮತ್ತು ಸಂಪೂರ್ಣ ದೃಶ್ಯಗಳ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ. ಅಪ್ಲಿಕೇಶನ್ ಸನ್ನಿವೇಶಗಳು - ಸಮುದ್ರ. ಬನ್ನಿ, ನಮ್ಮ ಸೇವೆಯನ್ನು ಪರೀಕ್ಷಿಸಿ, ಅತ್ಯಂತ ಟ್ರಿಕಿ ಕಾರ್ಯಗಳನ್ನು ಹೊಂದಿಸಿ. ಮೊದಲ 5000 ವಹಿವಾಟುಗಳು ಉಚಿತ. ಬಹುಶಃ ಇದು ನಿಮ್ಮ ಯೋಜನೆಗಳಿಗೆ "ಕಾಣೆಯಾದ ಘಟಕಾಂಶವಾಗಿದೆ".

ನೋಂದಣಿ ಮತ್ತು ಸಂಪರ್ಕದ ಮೇಲೆ ನೀವು ತಕ್ಷಣ API ಅನ್ನು ಪ್ರವೇಶಿಸಬಹುದು. ವಿಷನ್. ಎಲ್ಲಾ ಹಬ್ರಾ ಬಳಕೆದಾರರು ಹೆಚ್ಚುವರಿ ವಹಿವಾಟುಗಳಿಗಾಗಿ ಪ್ರಚಾರ ಕೋಡ್ ಅನ್ನು ಸ್ವೀಕರಿಸುತ್ತಾರೆ. ನಿಮ್ಮ ಖಾತೆಯನ್ನು ನೋಂದಾಯಿಸಲು ನೀವು ಬಳಸಿದ ಇಮೇಲ್ ವಿಳಾಸವನ್ನು ದಯವಿಟ್ಟು ನನಗೆ ಬರೆಯಿರಿ!

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ