ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಕೆಲವು ತಿಂಗಳ ಹಿಂದೆ, Google ನಿಂದ ನಮ್ಮ ಸಹೋದ್ಯೋಗಿಗಳು ಖರ್ಚು ಮಾಡಿದೆ ಸೆನ್ಸೇಷನಲ್‌ನಲ್ಲಿ ಪಡೆದ ಚಿತ್ರಗಳಿಗೆ ವರ್ಗೀಕರಣವನ್ನು ರಚಿಸಲು Kaggle ಸ್ಪರ್ಧೆ ಆಟ "ತ್ವರಿತ, ಡ್ರಾ!" ಯಾಂಡೆಕ್ಸ್ ಡೆವಲಪರ್ ರೋಮನ್ ವ್ಲಾಸೊವ್ ಅವರನ್ನು ಒಳಗೊಂಡ ತಂಡವು ಸ್ಪರ್ಧೆಯಲ್ಲಿ ನಾಲ್ಕನೇ ಸ್ಥಾನವನ್ನು ಪಡೆದುಕೊಂಡಿತು. ಜನವರಿಯಲ್ಲಿ ನಡೆದ ಯಂತ್ರ ಕಲಿಕೆಯ ತರಬೇತಿಯಲ್ಲಿ, ರೋಮನ್ ತನ್ನ ತಂಡದ ಆಲೋಚನೆಗಳು, ವರ್ಗೀಕರಣದ ಅಂತಿಮ ಅನುಷ್ಠಾನ ಮತ್ತು ಅವರ ವಿರೋಧಿಗಳ ಆಸಕ್ತಿದಾಯಕ ಅಭ್ಯಾಸಗಳನ್ನು ಹಂಚಿಕೊಂಡರು.


- ಎಲ್ಲರಿಗು ನಮಸ್ಖರ! ನನ್ನ ಹೆಸರು ರೋಮಾ ವ್ಲಾಸೊವ್, ಇಂದು ನಾನು ನಿಮಗೆ ತ್ವರಿತ, ಡ್ರಾ ಬಗ್ಗೆ ಹೇಳುತ್ತೇನೆ! ಡೂಡಲ್ ಗುರುತಿಸುವಿಕೆ ಸವಾಲು.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ನಮ್ಮ ತಂಡದಲ್ಲಿ ಐದು ಜನರಿದ್ದರು. ನಾನು ವಿಲೀನದ ಗಡುವಿನ ಮೊದಲು ಸೇರಿದೆ. ನಾವು ದುರದೃಷ್ಟವಂತರು, ನಾವು ಸ್ವಲ್ಪ ಅಲುಗಾಡಿದ್ದೇವೆ, ಆದರೆ ನಾವು ಹಣದ ಸ್ಥಾನದಿಂದ ಅಲುಗಾಡಿದ್ದೇವೆ ಮತ್ತು ಅವರು ಚಿನ್ನದ ಸ್ಥಾನದಿಂದ ಅಲುಗಾಡಿದರು. ಮತ್ತು ನಾವು ಗೌರವಾನ್ವಿತ ನಾಲ್ಕನೇ ಸ್ಥಾನವನ್ನು ಪಡೆದುಕೊಂಡಿದ್ದೇವೆ.

(ಸ್ಪರ್ಧೆಯ ಸಮಯದಲ್ಲಿ, ತಂಡಗಳು ತಮ್ಮನ್ನು ರೇಟಿಂಗ್‌ನಲ್ಲಿ ಗಮನಿಸಿದವು, ಇದು ಪ್ರಸ್ತಾವಿತ ಡೇಟಾ ಸೆಟ್‌ನ ಒಂದು ಭಾಗದಲ್ಲಿ ತೋರಿಸಲಾದ ಫಲಿತಾಂಶಗಳ ಆಧಾರದ ಮೇಲೆ ರೂಪುಗೊಂಡಿತು. ಅಂತಿಮ ರೇಟಿಂಗ್, ಪ್ರತಿಯಾಗಿ, ಡೇಟಾಸೆಟ್‌ನ ಇನ್ನೊಂದು ಭಾಗದಲ್ಲಿ ರಚಿಸಲಾಗಿದೆ. ಇದನ್ನು ಹೀಗೆ ಮಾಡಲಾಗುತ್ತದೆ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಭಾಗವಹಿಸುವವರು ತಮ್ಮ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ಡೇಟಾಗೆ ಹೊಂದಿಸುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಫೈನಲ್‌ನಲ್ಲಿ, ರೇಟಿಂಗ್‌ಗಳ ನಡುವೆ ಬದಲಾಯಿಸುವಾಗ, ಸ್ಥಾನಗಳು ಸ್ವಲ್ಪ ಅಲುಗಾಡುತ್ತವೆ (ಇಂಗ್ಲಿಷ್‌ನಿಂದ ಶೇಕ್ ಅಪ್ - ಮಿಶ್ರಣ ಮಾಡಲು): ಇತರ ಡೇಟಾದಲ್ಲಿ, ಫಲಿತಾಂಶವು ಹೊರಹೊಮ್ಮಬಹುದು ವಿಭಿನ್ನವಾಗಿರಲು, ರೋಮನ್ ತಂಡವು ಮೊದಲ ಮೂರರಲ್ಲಿ ಮೊದಲ ಸ್ಥಾನದಲ್ಲಿತ್ತು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಮೊದಲ ಮೂರು ಸ್ಥಾನಗಳು ಹಣ, ವಿತ್ತೀಯ ರೇಟಿಂಗ್ ವಲಯವಾಗಿದೆ, ಏಕೆಂದರೆ ಮೊದಲ ಮೂರು ಸ್ಥಾನಗಳಿಗೆ ಮಾತ್ರ ನಗದು ಬಹುಮಾನವನ್ನು ನೀಡಲಾಯಿತು. ಶೇಕ್-ಅಪ್ ನಂತರ, ತಂಡವು ಈಗಾಗಲೇ ನಾಲ್ಕನೇ ಸ್ಥಾನ, ಅದೇ ರೀತಿಯಲ್ಲಿ, ಇತರ ತಂಡವು ಗೆಲುವು, ಚಿನ್ನದ ಸ್ಥಾನವನ್ನು ಕಳೆದುಕೊಂಡಿತು. - ಎಡ್.)

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಎವ್ಗೆನಿ ಬಾಬಖ್ನಿನ್ ಗ್ರ್ಯಾಂಡ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ಇವಾನ್ ಸೊಸಿನ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ರೋಮನ್ ಸೊಲೊವಿವ್ ಗ್ರ್ಯಾಂಡ್ ಮಾಸ್ಟರ್ ಆಗಿ ಉಳಿದರು, ಅಲೆಕ್ಸ್ ಪರಿನೋವ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ನಾನು ಪರಿಣಿತನಾಗಿದ್ದೇನೆ ಮತ್ತು ಈಗ ನಾನು ಈಗಾಗಲೇ ಮಾಸ್ಟರ್ ಆಗಿದ್ದೇನೆ ಎಂಬ ಸ್ಪರ್ಧೆಯು ಗಮನಾರ್ಹವಾಗಿದೆ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಈ ಕ್ವಿಕ್, ಡ್ರಾ ಎಂದರೇನು? ಇದು Google ನಿಂದ ಸೇವೆಯಾಗಿದೆ. AI ಅನ್ನು ಜನಪ್ರಿಯಗೊಳಿಸುವ ಗುರಿಯನ್ನು Google ಹೊಂದಿತ್ತು ಮತ್ತು ಈ ಸೇವೆಯೊಂದಿಗೆ ನರ ನೆಟ್‌ವರ್ಕ್‌ಗಳು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ತೋರಿಸಲು ಬಯಸಿದೆ. ನೀವು ಅಲ್ಲಿಗೆ ಹೋಗಿ, ಲೆಟ್ಸ್ ಡ್ರಾ ಅನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಿಮಗೆ ಹೇಳಲಾದ ಹೊಸ ಪುಟವು ಪಾಪ್ ಅಪ್ ಆಗುತ್ತದೆ: ಅಂಕುಡೊಂಕು ಎಳೆಯಿರಿ, ಇದನ್ನು ಮಾಡಲು ನಿಮಗೆ 20 ಸೆಕೆಂಡುಗಳಿವೆ. ನೀವು 20 ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಅಂಕುಡೊಂಕು ಸೆಳೆಯಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ, ಉದಾಹರಣೆಗೆ, ಇಲ್ಲಿ. ನೀವು ಯಶಸ್ವಿಯಾದರೆ, ನೆಟ್ವರ್ಕ್ ಇದು ಅಂಕುಡೊಂಕು ಎಂದು ಹೇಳುತ್ತದೆ ಮತ್ತು ನೀವು ಮುಂದುವರಿಯಿರಿ. ಅಂತಹ ಚಿತ್ರಗಳು ಕೇವಲ ಆರು ಇವೆ.

ನೀವು ಚಿತ್ರಿಸಿದುದನ್ನು ಗುರುತಿಸಲು Google ನ ನೆಟ್‌ವರ್ಕ್ ವಿಫಲವಾದರೆ, ಕಾರ್ಯದ ಮೇಲೆ ಅಡ್ಡ ಹಾಕಲಾಗುತ್ತದೆ. ನೆಟ್‌ವರ್ಕ್‌ನಿಂದ ಡ್ರಾಯಿಂಗ್ ಗುರುತಿಸಲ್ಪಟ್ಟಿದೆಯೇ ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದು ಭವಿಷ್ಯದಲ್ಲಿ ಇದರ ಅರ್ಥವೇನೆಂದು ನಂತರ ನಾನು ನಿಮಗೆ ಹೇಳುತ್ತೇನೆ.

ಈ ಸೇವೆಯು ಸಾಕಷ್ಟು ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಬಳಕೆದಾರರನ್ನು ಸಂಗ್ರಹಿಸಿದೆ ಮತ್ತು ಬಳಕೆದಾರರು ಚಿತ್ರಿಸಿದ ಎಲ್ಲಾ ಚಿತ್ರಗಳನ್ನು ಲಾಗ್ ಮಾಡಲಾಗಿದೆ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ನಾವು ಸುಮಾರು 50 ಮಿಲಿಯನ್ ಚಿತ್ರಗಳನ್ನು ಸಂಗ್ರಹಿಸುವಲ್ಲಿ ಯಶಸ್ವಿಯಾಗಿದ್ದೇವೆ. ಇದರಿಂದ ನಮ್ಮ ಸ್ಪರ್ಧೆಗೆ ರೈಲು ಮತ್ತು ಪರೀಕ್ಷಾ ದಿನಾಂಕ ರೂಪುಗೊಂಡಿತು. ಮೂಲಕ, ಪರೀಕ್ಷೆಯಲ್ಲಿನ ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಒಂದು ಕಾರಣಕ್ಕಾಗಿ ದಪ್ಪದಲ್ಲಿ ಹೈಲೈಟ್ ಮಾಡಲಾಗುತ್ತದೆ. ಸ್ವಲ್ಪ ಸಮಯದ ನಂತರ ನಾನು ಅವರ ಬಗ್ಗೆ ಹೇಳುತ್ತೇನೆ.

ಡೇಟಾ ಸ್ವರೂಪವು ಈ ಕೆಳಗಿನಂತಿತ್ತು. ಇವು ಕೇವಲ RGB ಚಿತ್ರಗಳಲ್ಲ, ಆದರೆ, ಸ್ಥೂಲವಾಗಿ ಹೇಳುವುದಾದರೆ, ಬಳಕೆದಾರರು ಮಾಡಿದ ಎಲ್ಲದರ ಲಾಗ್. ಪದವು ನಮ್ಮ ಗುರಿಯಾಗಿದೆ, ಡೂಡಲ್‌ನ ಲೇಖಕರು ಎಲ್ಲಿಂದ ಬಂದವರು ಕಂಟ್ರಿಕೋಡ್, ಟೈಮ್‌ಸ್ಟ್ಯಾಂಪ್ ಸಮಯ. ಗುರುತಿಸಲಾದ ಲೇಬಲ್ Google ನಿಂದ ಚಿತ್ರವನ್ನು ನೆಟ್‌ವರ್ಕ್ ಗುರುತಿಸಿದೆಯೇ ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ. ಮತ್ತು ರೇಖಾಚಿತ್ರವು ಒಂದು ಅನುಕ್ರಮವಾಗಿದೆ, ಬಳಕೆದಾರರು ಅಂಕಗಳೊಂದಿಗೆ ಸೆಳೆಯುವ ವಕ್ರರೇಖೆಯ ಅಂದಾಜು. ಮತ್ತು ಸಮಯಗಳು. ಚಿತ್ರ ಬಿಡಿಸುವ ಆರಂಭದ ಸಮಯ ಇದು.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಡೇಟಾವನ್ನು ಎರಡು ಸ್ವರೂಪಗಳಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ. ಇದು ಮೊದಲ ಸ್ವರೂಪವಾಗಿದೆ, ಮತ್ತು ಎರಡನೆಯದನ್ನು ಸರಳೀಕರಿಸಲಾಗಿದೆ. ಅವರು ಅಲ್ಲಿಂದ ಸಮಯವನ್ನು ಕಡಿತಗೊಳಿಸಿದರು ಮತ್ತು ಈ ಬಿಂದುಗಳ ಗುಂಪನ್ನು ಚಿಕ್ಕ ಅಂಕಗಳೊಂದಿಗೆ ಅಂದಾಜು ಮಾಡಿದರು. ಇದಕ್ಕಾಗಿ ಅವರು ಬಳಸಿದರು ಡೌಗ್ಲಾಸ್-ಪೆಕರ್ ಅಲ್ಗಾರಿದಮ್. ನೀವು ಸರಳ ರೇಖೆಯನ್ನು ಸರಳವಾಗಿ ಅಂದಾಜು ಮಾಡುವ ಬಿಂದುಗಳ ದೊಡ್ಡ ಗುಂಪನ್ನು ಹೊಂದಿದ್ದೀರಿ, ಆದರೆ ವಾಸ್ತವವಾಗಿ ನೀವು ಈ ರೇಖೆಯನ್ನು ಕೇವಲ ಎರಡು ಅಂಕಗಳೊಂದಿಗೆ ಅಂದಾಜು ಮಾಡಬಹುದು. ಇದು ಅಲ್ಗಾರಿದಮ್‌ನ ಕಲ್ಪನೆ.

ಡೇಟಾವನ್ನು ಈ ಕೆಳಗಿನಂತೆ ವಿತರಿಸಲಾಗಿದೆ. ಎಲ್ಲವೂ ಏಕರೂಪವಾಗಿದೆ, ಆದರೆ ಕೆಲವು ಔಟ್ಲೈಯರ್ಗಳಿವೆ. ನಾವು ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಿದಾಗ, ನಾವು ಅದನ್ನು ನೋಡಲಿಲ್ಲ. ಮುಖ್ಯ ವಿಷಯವೆಂದರೆ ನಿಜವಾಗಿಯೂ ಕಡಿಮೆ ಇರುವ ಯಾವುದೇ ತರಗತಿಗಳು ಇರಲಿಲ್ಲ, ನಾವು ತೂಕದ ಮಾದರಿಗಳು ಮತ್ತು ಡೇಟಾ ಓವರ್‌ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮಾಡಬೇಕಾಗಿಲ್ಲ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಚಿತ್ರಗಳು ಹೇಗಿದ್ದವು? ಇದು "ಏರೋಪ್ಲೇನ್" ವರ್ಗ ಮತ್ತು ಅದರ ಉದಾಹರಣೆಗಳು ಗುರುತಿಸಲ್ಪಟ್ಟ ಮತ್ತು ಗುರುತಿಸದ ಲೇಬಲ್‌ಗಳೊಂದಿಗೆ. ಅವರ ಅನುಪಾತವು ಎಲ್ಲೋ 1 ರಿಂದ 9 ರಷ್ಟಿತ್ತು. ನೀವು ನೋಡುವಂತೆ, ಡೇಟಾವು ಸಾಕಷ್ಟು ಗದ್ದಲದಂತಿದೆ. ಇದು ವಿಮಾನ ಎಂದು ನಾನು ಊಹಿಸುತ್ತೇನೆ. ನೀವು ಗುರುತಿಸಲಾಗಿಲ್ಲ ಎಂದು ನೋಡಿದರೆ, ಹೆಚ್ಚಿನ ಸಂದರ್ಭಗಳಲ್ಲಿ ಅದು ಕೇವಲ ಶಬ್ದವಾಗಿದೆ. ಯಾರೋ ಒಬ್ಬರು "ಏರೋಪ್ಲೇನ್" ಎಂದು ಬರೆಯಲು ಪ್ರಯತ್ನಿಸಿದರು, ಆದರೆ ಸ್ಪಷ್ಟವಾಗಿ ಫ್ರೆಂಚ್ನಲ್ಲಿ.

ಹೆಚ್ಚಿನ ಭಾಗವಹಿಸುವವರು ಸರಳವಾಗಿ ಗ್ರಿಡ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರು, ಈ ಸಾಲುಗಳ ಅನುಕ್ರಮದಿಂದ ಡೇಟಾವನ್ನು RGB ಚಿತ್ರಗಳಾಗಿ ಚಿತ್ರಿಸಿದರು ಮತ್ತು ಅವುಗಳನ್ನು ನೆಟ್‌ವರ್ಕ್‌ಗೆ ಎಸೆದರು. ನಾನು ಸರಿಸುಮಾರು ಅದೇ ರೀತಿಯಲ್ಲಿ ಚಿತ್ರಿಸಿದ್ದೇನೆ: ನಾನು ಬಣ್ಣಗಳ ಪ್ಯಾಲೆಟ್ ಅನ್ನು ತೆಗೆದುಕೊಂಡೆ, ಮೊದಲ ರೇಖೆಯನ್ನು ಒಂದು ಬಣ್ಣದಿಂದ ಚಿತ್ರಿಸಿದೆ, ಅದು ಈ ಪ್ಯಾಲೆಟ್ನ ಆರಂಭದಲ್ಲಿದೆ, ಇನ್ನೊಂದು ಕೊನೆಯ ಸಾಲು, ಅದು ಪ್ಯಾಲೆಟ್ನ ಕೊನೆಯಲ್ಲಿ ಮತ್ತು ಅವುಗಳ ನಡುವೆ ಇತ್ತು. ನಾನು ಈ ಪ್ಯಾಲೆಟ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಎಲ್ಲೆಡೆ ಇಂಟರ್ಪೋಲೇಟ್ ಮಾಡಿದ್ದೇನೆ. ಅಂದಹಾಗೆ, ಇದು ನೀವು ಮೊದಲ ಸ್ಲೈಡ್‌ನಲ್ಲಿ ಚಿತ್ರಿಸುವುದಕ್ಕಿಂತ ಉತ್ತಮ ಫಲಿತಾಂಶವನ್ನು ನೀಡಿತು - ಕೇವಲ ಕಪ್ಪು ಬಣ್ಣದಲ್ಲಿ.

ಇತರ ತಂಡದ ಸದಸ್ಯರು, ಉದಾಹರಣೆಗೆ ಇವಾನ್ ಸೊಸಿನ್, ರೇಖಾಚಿತ್ರಕ್ಕೆ ಸ್ವಲ್ಪ ವಿಭಿನ್ನ ವಿಧಾನಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿದರು. ಒಂದು ಚಾನೆಲ್‌ನೊಂದಿಗೆ ಅವರು ಸರಳವಾಗಿ ಬೂದು ಚಿತ್ರವನ್ನು ಚಿತ್ರಿಸಿದರು, ಇನ್ನೊಂದು ಚಾನಲ್‌ನೊಂದಿಗೆ ಅವರು 32 ರಿಂದ 255 ರವರೆಗಿನ ಗ್ರೇಡಿಯಂಟ್‌ನೊಂದಿಗೆ ಪ್ರತಿ ಸ್ಟ್ರೋಕ್ ಅನ್ನು ಮೊದಲಿನಿಂದ ಕೊನೆಯವರೆಗೆ ಎಳೆದರು ಮತ್ತು ಮೂರನೇ ಚಾನಲ್‌ನೊಂದಿಗೆ ಅವರು 32 ರಿಂದ 255 ರವರೆಗಿನ ಎಲ್ಲಾ ಸ್ಟ್ರೋಕ್‌ಗಳ ಮೇಲೆ ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಚಿತ್ರಿಸಿದರು.

ಮತ್ತೊಂದು ಕುತೂಹಲಕಾರಿ ವಿಷಯವೆಂದರೆ ಅಲೆಕ್ಸ್ ಪ್ಯಾರಿನೋವ್ ಅವರು ದೇಶದ ಕೋಡ್ ಬಳಸಿ ನೆಟ್‌ವರ್ಕ್‌ಗೆ ಮಾಹಿತಿಯನ್ನು ಅಪ್‌ಲೋಡ್ ಮಾಡಿದ್ದಾರೆ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಬಳಸಲಾದ ಮೆಟ್ರಿಕ್ ಸರಾಸರಿ ಸರಾಸರಿ ನಿಖರತೆಯಾಗಿದೆ. ಸ್ಪರ್ಧೆಗಾಗಿ ಈ ಮೆಟ್ರಿಕ್‌ನ ಮೂಲತತ್ವ ಏನು? ನೀವು ಮೂರು ಮುನ್ಸೂಚನೆಗಳನ್ನು ನೀಡಬಹುದು, ಮತ್ತು ಈ ಮೂರರಲ್ಲಿ ಸರಿಯಾದ ಮುನ್ಸೂಚನೆ ಇಲ್ಲದಿದ್ದರೆ, ನೀವು 0 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಸರಿಯಾದ ಒಂದು ಇದ್ದರೆ, ಅದರ ಕ್ರಮವನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಲಾಗುತ್ತದೆ. ಮತ್ತು ಗುರಿ ಫಲಿತಾಂಶವನ್ನು ನಿಮ್ಮ ಭವಿಷ್ಯವಾಣಿಯ ಕ್ರಮದಿಂದ ಭಾಗಿಸಿ 1 ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಮೂರು ಮುನ್ಸೂಚಕಗಳನ್ನು ಮಾಡಿದ್ದೀರಿ, ಮತ್ತು ಸರಿಯಾದದು ಮೊದಲನೆಯದು, ನಂತರ ನೀವು 1 ರಿಂದ 1 ಭಾಗಿಸಿ ಮತ್ತು 1 ಅನ್ನು ಪಡೆದುಕೊಳ್ಳಿ. ಪ್ರಿಡಿಕ್ಟರ್ ಸರಿಯಾಗಿದ್ದರೆ ಮತ್ತು ಅದರ ಕ್ರಮವು 2 ಆಗಿದ್ದರೆ, ನಂತರ 1 ರಿಂದ 2 ರಿಂದ ಭಾಗಿಸಿ, ನೀವು 0,5 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಸರಿ, ಇತ್ಯಾದಿ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಡೇಟಾ ಪ್ರಿಪ್ರೊಸೆಸಿಂಗ್‌ನೊಂದಿಗೆ - ಚಿತ್ರಗಳನ್ನು ಹೇಗೆ ಸೆಳೆಯುವುದು ಮತ್ತು ಹೀಗೆ - ನಾವು ಸ್ವಲ್ಪ ನಿರ್ಧರಿಸಿದ್ದೇವೆ. ನಾವು ಯಾವ ವಾಸ್ತುಶಿಲ್ಪಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ? ನಾವು PNASNet, SENet ನಂತಹ ಫ್ಯಾಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳನ್ನು ಬಳಸಲು ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ ಮತ್ತು SE-Res-NeXt ನಂತಹ ಈಗಾಗಲೇ ಕ್ಲಾಸಿಕ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳನ್ನು ಬಳಸಲು ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ, ಅವುಗಳು ಹೆಚ್ಚು ಹೊಸ ಸ್ಪರ್ಧೆಗಳನ್ನು ಪ್ರವೇಶಿಸುತ್ತಿವೆ. ResNet ಮತ್ತು DenseNet ಸಹ ಇದ್ದವು.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ನಾವು ಇದನ್ನು ಹೇಗೆ ಕಲಿಸಿದ್ದೇವೆ? ನಾವು ತೆಗೆದುಕೊಂಡ ಎಲ್ಲಾ ಮಾದರಿಗಳು ಇಮೇಜ್‌ನೆಟ್‌ನಲ್ಲಿ ಪೂರ್ವ ತರಬೇತಿ ಪಡೆದವು. ಸಾಕಷ್ಟು ಡೇಟಾ ಇದ್ದರೂ, 50 ಮಿಲಿಯನ್ ಚಿತ್ರಗಳು, ಆದರೆ ಇನ್ನೂ, ನೀವು ಇಮೇಜ್‌ನೆಟ್‌ನಲ್ಲಿ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ತೆಗೆದುಕೊಂಡರೆ, ನೀವು ಅದನ್ನು ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡುವುದಕ್ಕಿಂತ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ತೋರಿಸಿದೆ.

ನಾವು ಯಾವ ಬೋಧನಾ ತಂತ್ರಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ? ಇದು ಬೆಚ್ಚಗಿನ ಪುನರಾರಂಭಗಳೊಂದಿಗೆ ಕೋಸಿಂಗ್ ಅನೆಲಿಂಗ್ ಆಗಿದೆ, ನಾನು ಸ್ವಲ್ಪ ಸಮಯದ ನಂತರ ಮಾತನಾಡುತ್ತೇನೆ. ಇದು ನನ್ನ ಇತ್ತೀಚಿನ ಎಲ್ಲಾ ಸ್ಪರ್ಧೆಗಳಲ್ಲಿ ನಾನು ಬಳಸುವ ತಂತ್ರವಾಗಿದೆ, ಮತ್ತು ಅವರೊಂದಿಗೆ ಉತ್ತಮವಾದ ಕನಿಷ್ಠವನ್ನು ಸಾಧಿಸಲು ಗ್ರಿಡ್‌ಗಳನ್ನು ಚೆನ್ನಾಗಿ ತರಬೇತಿ ಮಾಡಲು ಇದು ತಿರುಗುತ್ತದೆ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಮುಂದೆ ಪ್ರಸ್ಥಭೂಮಿಯಲ್ಲಿ ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆ ಮಾಡಿ. ನೀವು ನೆಟ್‌ವರ್ಕ್‌ಗೆ ತರಬೇತಿ ನೀಡಲು ಪ್ರಾರಂಭಿಸಿ, ನಿರ್ದಿಷ್ಟ ಕಲಿಕೆಯ ದರವನ್ನು ಹೊಂದಿಸಿ, ಅದನ್ನು ಕಲಿಸುವುದನ್ನು ಮುಂದುವರಿಸಿ ಮತ್ತು ನಿಮ್ಮ ನಷ್ಟವು ಕ್ರಮೇಣ ಒಂದು ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಕ್ಕೆ ಒಮ್ಮುಖವಾಗುತ್ತದೆ. ನೀವು ಇದನ್ನು ಪರಿಶೀಲಿಸಿ, ಉದಾಹರಣೆಗೆ, ಹತ್ತು ಯುಗಗಳವರೆಗೆ ನಷ್ಟವು ಬದಲಾಗಿಲ್ಲ. ನೀವು ನಿಮ್ಮ ಕಲಿಕೆಯ ದರವನ್ನು ಸ್ವಲ್ಪ ಮೌಲ್ಯದಿಂದ ಕಡಿಮೆ ಮಾಡಿ ಮತ್ತು ಕಲಿಕೆಯನ್ನು ಮುಂದುವರಿಸಿ. ಇದು ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಇಳಿಯುತ್ತದೆ, ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಒಮ್ಮುಖವಾಗುತ್ತದೆ, ಮತ್ತು ನೀವು ಮತ್ತೆ ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆಗೊಳಿಸುತ್ತೀರಿ, ಮತ್ತು ಹೀಗೆ, ನಿಮ್ಮ ನೆಟ್‌ವರ್ಕ್ ಅಂತಿಮವಾಗಿ ಒಮ್ಮುಖವಾಗುವವರೆಗೆ.

ಮುಂದಿನದು ಆಸಕ್ತಿದಾಯಕ ತಂತ್ರವಾಗಿದೆ: ಕಲಿಕೆಯ ದರವನ್ನು ಕೊಳೆಯಬೇಡಿ, ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ಹೆಚ್ಚಿಸಿ. ಅದೇ ಹೆಸರಿನ ಲೇಖನವಿದೆ. ನೀವು ನೆಟ್‌ವರ್ಕ್‌ಗೆ ತರಬೇತಿ ನೀಡಿದಾಗ, ನೀವು ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆ ಮಾಡಬೇಕಾಗಿಲ್ಲ, ನೀವು ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.

ಈ ತಂತ್ರವನ್ನು ಅಲೆಕ್ಸ್ ಪ್ಯಾರಿನೋವ್ ಬಳಸಿದ್ದಾರೆ. ಅವರು 408 ಕ್ಕೆ ಸಮಾನವಾದ ಬ್ಯಾಚ್‌ನೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿದರು, ಮತ್ತು ಅವರ ನೆಟ್‌ವರ್ಕ್ ಕೆಲವು ಪ್ರಸ್ಥಭೂಮಿಯನ್ನು ತಲುಪಿದಾಗ, ಅವರು ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ದ್ವಿಗುಣಗೊಳಿಸಿದರು, ಇತ್ಯಾದಿ.

ವಾಸ್ತವವಾಗಿ, ಅವನ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಯಾವ ಮೌಲ್ಯವನ್ನು ತಲುಪಿದೆ ಎಂದು ನನಗೆ ನೆನಪಿಲ್ಲ, ಆದರೆ ಕುತೂಹಲಕಾರಿ ಸಂಗತಿಯೆಂದರೆ ಅದೇ ತಂತ್ರವನ್ನು ಬಳಸಿದ ತಂಡಗಳು ಕಾಗಲ್‌ನಲ್ಲಿ ಇದ್ದವು, ಅವುಗಳ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಸುಮಾರು 10000 ಆಗಿತ್ತು. ಅಂದಹಾಗೆ, ಆಳವಾದ ಕಲಿಕೆಗಾಗಿ ಆಧುನಿಕ ಚೌಕಟ್ಟುಗಳು, ಉದಾಹರಣೆಗೆ PyTorch, ಉದಾಹರಣೆಗೆ, ಇದನ್ನು ಬಹಳ ಸುಲಭವಾಗಿ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ನೀವು ನಿಮ್ಮ ಬ್ಯಾಚ್ ಅನ್ನು ರಚಿಸುತ್ತೀರಿ ಮತ್ತು ಅದನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ನೆಟ್‌ವರ್ಕ್‌ಗೆ ಸಲ್ಲಿಸಿ, ಆದರೆ ಅದನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ ಇದರಿಂದ ಅದು ನಿಮ್ಮ ವೀಡಿಯೊ ಕಾರ್ಡ್‌ಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ, ಗ್ರೇಡಿಯಂಟ್‌ಗಳನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ ಮತ್ತು ನೀವು ಸಂಪೂರ್ಣ ಬ್ಯಾಚ್‌ಗೆ ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಲೆಕ್ಕ ಹಾಕಿದ ನಂತರ, ನವೀಕರಿಸಿ ತೂಕಗಳು.

ಅಂದಹಾಗೆ, ಈ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ದೊಡ್ಡ ಬ್ಯಾಚ್ ಗಾತ್ರಗಳನ್ನು ಇನ್ನೂ ಸೇರಿಸಲಾಗಿದೆ, ಏಕೆಂದರೆ ಡೇಟಾವು ಸಾಕಷ್ಟು ಗದ್ದಲದಂತಿತ್ತು ಮತ್ತು ದೊಡ್ಡ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ಅಂದಾಜು ಮಾಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ಸ್ಯೂಡೋ-ಲೇಬಲಿಂಗ್ ಅನ್ನು ಸಹ ಬಳಸಲಾಗುತ್ತಿತ್ತು, ಹೆಚ್ಚಾಗಿ ರೋಮನ್ ಸೊಲೊವೀವ್ ಬಳಸಿದರು. ಅವರು ಪರೀಕ್ಷೆಯಿಂದ ಅರ್ಧದಷ್ಟು ಡೇಟಾವನ್ನು ಬ್ಯಾಚ್‌ಗಳಲ್ಲಿ ಸ್ಯಾಂಪಲ್ ಮಾಡಿದರು ಮತ್ತು ಅಂತಹ ಬ್ಯಾಚ್‌ಗಳಲ್ಲಿ ಗ್ರಿಡ್‌ಗೆ ತರಬೇತಿ ನೀಡಿದರು.

ಚಿತ್ರಗಳ ಗಾತ್ರವು ಮುಖ್ಯವಾದುದು, ಆದರೆ ನೀವು ಸಾಕಷ್ಟು ಡೇಟಾವನ್ನು ಹೊಂದಿದ್ದೀರಿ, ನೀವು ದೀರ್ಘಕಾಲದವರೆಗೆ ತರಬೇತಿ ನೀಡಬೇಕಾಗಿದೆ ಮತ್ತು ನಿಮ್ಮ ಚಿತ್ರದ ಗಾತ್ರವು ಸಾಕಷ್ಟು ದೊಡ್ಡದಾಗಿದ್ದರೆ, ನೀವು ಬಹಳ ಸಮಯದವರೆಗೆ ತರಬೇತಿ ನೀಡುತ್ತೀರಿ. ಆದರೆ ಇದು ನಿಮ್ಮ ಅಂತಿಮ ವರ್ಗೀಕರಣದ ಗುಣಮಟ್ಟಕ್ಕೆ ಹೆಚ್ಚಿನದನ್ನು ಸೇರಿಸಲಿಲ್ಲ, ಆದ್ದರಿಂದ ಕೆಲವು ರೀತಿಯ ವ್ಯಾಪಾರವನ್ನು ಬಳಸುವುದು ಯೋಗ್ಯವಾಗಿದೆ. ಮತ್ತು ನಾವು ಗಾತ್ರದಲ್ಲಿ ತುಂಬಾ ದೊಡ್ಡದಲ್ಲದ ಚಿತ್ರಗಳನ್ನು ಮಾತ್ರ ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ.

ಇದೆಲ್ಲ ಕಲಿತಿದ್ದು ಹೇಗೆ? ಮೊದಲಿಗೆ, ಸಣ್ಣ ಗಾತ್ರದ ಚಿತ್ರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲಾಗಿದೆ, ಹಲವಾರು ಯುಗಗಳನ್ನು ಅವುಗಳ ಮೇಲೆ ನಡೆಸಲಾಯಿತು, ಇದು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ತೆಗೆದುಕೊಂಡಿತು. ನಂತರ ದೊಡ್ಡ ಗಾತ್ರದ ಚಿತ್ರಗಳನ್ನು ನೀಡಲಾಯಿತು, ನೆಟ್‌ವರ್ಕ್‌ಗೆ ತರಬೇತಿ ನೀಡಲಾಯಿತು, ನಂತರ ಇನ್ನೂ ಹೆಚ್ಚು, ಇನ್ನಷ್ಟು, ಆದ್ದರಿಂದ ಅದನ್ನು ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡದಂತೆ ಮತ್ತು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ವ್ಯರ್ಥ ಮಾಡಬೇಡಿ.

ಆಪ್ಟಿಮೈಜರ್‌ಗಳ ಬಗ್ಗೆ. ನಾವು SGD ಮತ್ತು ಆಡಮ್ ಅನ್ನು ಬಳಸಿದ್ದೇವೆ. ಈ ರೀತಿಯಾಗಿ ಒಂದೇ ಮಾದರಿಯನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಯಿತು, ಇದು ಸಾರ್ವಜನಿಕ ಲೀಡರ್‌ಬೋರ್ಡ್‌ನಲ್ಲಿ 0,941-0,946 ವೇಗವನ್ನು ನೀಡಿತು, ಇದು ಸಾಕಷ್ಟು ಉತ್ತಮವಾಗಿದೆ.

ನೀವು ಕೆಲವು ರೀತಿಯಲ್ಲಿ ಮಾದರಿಗಳನ್ನು ಸಂಯೋಜಿಸಿದರೆ, ನೀವು ಎಲ್ಲೋ ಸುಮಾರು 0,951 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ನೀವು ಇನ್ನೂ ಒಂದು ತಂತ್ರವನ್ನು ಬಳಸಿದರೆ, ನಾವು ಪಡೆದಂತೆಯೇ ನೀವು ಸಾರ್ವಜನಿಕ ಮಂಡಳಿಯಲ್ಲಿ 0,954 ಅಂತಿಮ ಸ್ಕೋರ್ ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಆದರೆ ನಂತರ ಹೆಚ್ಚು. ಮುಂದೆ ನಾವು ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ಜೋಡಿಸಿದ್ದೇವೆ ಮತ್ತು ಅಂತಹ ಅಂತಿಮ ವೇಗವನ್ನು ಸಾಧಿಸಲು ನಾವು ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತಿದ್ದೇವೆ ಎಂದು ನಾನು ನಿಮಗೆ ಹೇಳುತ್ತೇನೆ.

ಮುಂದೆ ನಾನು ವಾರ್ಮ್ ರೀಸ್ಟಾರ್ಟ್‌ಗಳೊಂದಿಗೆ ಕೋಸಿಂಗ್ ಅನೆಲಿಂಗ್ ಅಥವಾ ವಾರ್ಮ್ ರೀಸ್ಟಾರ್ಟ್‌ಗಳೊಂದಿಗೆ ಸ್ಟೊಕಾಸ್ಟಿಕ್ ಗ್ರೇಡಿಯಂಟ್ ಡಿಸೆಂಟ್ ಕುರಿತು ಮಾತನಾಡಲು ಬಯಸುತ್ತೇನೆ. ಸ್ಥೂಲವಾಗಿ ಹೇಳುವುದಾದರೆ, ತಾತ್ವಿಕವಾಗಿ, ನೀವು ಯಾವುದೇ ಆಪ್ಟಿಮೈಜರ್ ಅನ್ನು ಬಳಸಬಹುದು, ಆದರೆ ಪಾಯಿಂಟ್ ಇದು: ನೀವು ಕೇವಲ ಒಂದು ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ತರಬೇತಿ ಮಾಡಿದರೆ ಮತ್ತು ಕ್ರಮೇಣ ಅದು ಕನಿಷ್ಠಕ್ಕೆ ಒಮ್ಮುಖವಾಗಿದ್ದರೆ, ಎಲ್ಲವೂ ಸರಿಯಾಗಿದೆ, ನೀವು ಒಂದು ನೆಟ್‌ವರ್ಕ್ ಪಡೆಯುತ್ತೀರಿ, ಅದು ಕೆಲವು ತಪ್ಪುಗಳನ್ನು ಮಾಡುತ್ತದೆ, ಆದರೆ ನೀವು ಸ್ವಲ್ಪ ವಿಭಿನ್ನವಾಗಿ ತರಬೇತಿ ನೀಡಬಹುದು. ನೀವು ಕೆಲವು ಆರಂಭಿಕ ಕಲಿಕೆಯ ದರವನ್ನು ಹೊಂದಿಸುತ್ತೀರಿ ಮತ್ತು ಈ ಸೂತ್ರದ ಪ್ರಕಾರ ಅದನ್ನು ಕ್ರಮೇಣ ಕಡಿಮೆಗೊಳಿಸುತ್ತೀರಿ. ನೀವು ಅದನ್ನು ಕಡಿಮೆ ಮಾಡಿ, ನಿಮ್ಮ ನೆಟ್‌ವರ್ಕ್ ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಬರುತ್ತದೆ, ನಂತರ ನೀವು ತೂಕವನ್ನು ಉಳಿಸುತ್ತೀರಿ ಮತ್ತು ತರಬೇತಿಯ ಆರಂಭದಲ್ಲಿದ್ದ ಕಲಿಕೆಯ ದರವನ್ನು ಮತ್ತೆ ಹೊಂದಿಸಿ, ಆ ಮೂಲಕ ಈ ಕನಿಷ್ಠದಿಂದ ಎಲ್ಲೋ ಮೇಲಕ್ಕೆ ಹೋಗಿ ಮತ್ತು ನಿಮ್ಮ ಕಲಿಕೆಯ ದರವನ್ನು ಮತ್ತೆ ಕಡಿಮೆ ಮಾಡಿ.

ಹೀಗಾಗಿ, ನೀವು ಏಕಕಾಲದಲ್ಲಿ ಹಲವಾರು ಕನಿಷ್ಠಗಳನ್ನು ಭೇಟಿ ಮಾಡಬಹುದು, ಇದರಲ್ಲಿ ನಿಮ್ಮ ನಷ್ಟವು ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್ ಆಗಿರುತ್ತದೆ. ಆದರೆ ವಾಸ್ತವವಾಗಿ ಈ ತೂಕವನ್ನು ಹೊಂದಿರುವ ನೆಟ್‌ವರ್ಕ್‌ಗಳು ನಿಮ್ಮ ದಿನಾಂಕದಂದು ವಿಭಿನ್ನ ದೋಷಗಳನ್ನು ನೀಡುತ್ತದೆ. ಅವುಗಳನ್ನು ಸರಾಸರಿ ಮಾಡುವ ಮೂಲಕ, ನೀವು ಕೆಲವು ರೀತಿಯ ಅಂದಾಜು ಪಡೆಯುತ್ತೀರಿ ಮತ್ತು ನಿಮ್ಮ ವೇಗವು ಹೆಚ್ಚಾಗಿರುತ್ತದೆ.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ನಾವು ನಮ್ಮ ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ಜೋಡಿಸಿದ್ದೇವೆ ಎಂಬುದರ ಕುರಿತು. ಪ್ರಸ್ತುತಿಯ ಆರಂಭದಲ್ಲಿ, ಪರೀಕ್ಷೆಯಲ್ಲಿನ ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಗೆ ಗಮನ ಕೊಡಲು ನಾನು ಹೇಳಿದೆ. ನೀವು ಪರೀಕ್ಷಾ ಸೆಟ್‌ನಲ್ಲಿನ ಗುರಿಗಳ ಸಂಖ್ಯೆಗೆ 1 ಅನ್ನು ಸೇರಿಸಿದರೆ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸಿದರೆ, ನೀವು 330 ಸಂಖ್ಯೆಯನ್ನು ಪಡೆಯುತ್ತೀರಿ, ಮತ್ತು ಇದನ್ನು ಫೋರಂನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ - ಪರೀಕ್ಷೆಯಲ್ಲಿ ತರಗತಿಗಳು ಸಮತೋಲಿತವಾಗಿವೆ. ಇದನ್ನು ಬಳಸಬಹುದಿತ್ತು.

ಇದರ ಆಧಾರದ ಮೇಲೆ, ರೋಮನ್ ಸೊಲೊವೀವ್ ಮೆಟ್ರಿಕ್‌ನೊಂದಿಗೆ ಬಂದರು, ನಾವು ಅದನ್ನು ಪ್ರಾಕ್ಸಿ ಸ್ಕೋರ್ ಎಂದು ಕರೆದಿದ್ದೇವೆ, ಇದು ಲೀಡರ್‌ಬೋರ್ಡ್‌ನೊಂದಿಗೆ ಚೆನ್ನಾಗಿ ಸಂಬಂಧ ಹೊಂದಿದೆ. ಮುಖ್ಯ ವಿಷಯವೆಂದರೆ: ನೀವು ಭವಿಷ್ಯವನ್ನು ಮಾಡುತ್ತೀರಿ, ನಿಮ್ಮ ಭವಿಷ್ಯಸೂಚಕಗಳಲ್ಲಿ ಅಗ್ರ 1 ಅನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ ಮತ್ತು ಪ್ರತಿ ವರ್ಗಕ್ಕೆ ವಸ್ತುಗಳ ಸಂಖ್ಯೆಯನ್ನು ಎಣಿಸಿ. ಮುಂದೆ, ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ 330 ಕಳೆಯಿರಿ ಮತ್ತು ಫಲಿತಾಂಶದ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳನ್ನು ಸೇರಿಸಿ.

ಕೆಳಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಪಡೆಯಲಾಗಿದೆ. ಇದು ಪ್ರೋಬಿಂಗ್ ಲೀಡರ್‌ಬೋರ್ಡ್ ಅನ್ನು ರಚಿಸಲು ನಮಗೆ ಸಹಾಯ ಮಾಡಿತು, ಆದರೆ ಸ್ಥಳೀಯವಾಗಿ ಮೌಲ್ಯೀಕರಿಸಲು ಮತ್ತು ನಮ್ಮ ಮೇಳಗಳಿಗೆ ಗುಣಾಂಕಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡಿತು.

ಒಂದು ಸಮೂಹದೊಂದಿಗೆ ನೀವು ಅಂತಹ ವೇಗವನ್ನು ಪಡೆಯಬಹುದು. ನಾನು ಇನ್ನೇನು ಮಾಡಬಲ್ಲೆ? ನಿಮ್ಮ ಪರೀಕ್ಷೆಯಲ್ಲಿನ ತರಗತಿಗಳು ಸಮತೋಲಿತವಾಗಿವೆ ಎಂಬ ಮಾಹಿತಿಯನ್ನು ನೀವು ಬಳಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸೋಣ.

ಸಮತೋಲನವು ವಿಭಿನ್ನವಾಗಿತ್ತು. ಅವುಗಳಲ್ಲಿ ಒಂದು ಉದಾಹರಣೆ - ಮೊದಲ ಸ್ಥಾನ ಪಡೆದ ಹುಡುಗರಿಂದ ಸಮತೋಲನ.

ನಾವೇನು ​​ಮಾಡಿದೆವು? ನಮ್ಮ ಸಮತೋಲನವು ತುಂಬಾ ಸರಳವಾಗಿತ್ತು, ಇದನ್ನು ಎವ್ಗೆನಿ ಬಾಬಖ್ನಿನ್ ಸೂಚಿಸಿದ್ದಾರೆ. ನಾವು ಮೊದಲು ನಮ್ಮ ಮುನ್ನೋಟಗಳನ್ನು ಟಾಪ್ 1 ಮತ್ತು ಅವರಲ್ಲಿ ಅಭ್ಯರ್ಥಿಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಿದ್ದೇವೆ - ಆದ್ದರಿಂದ ತರಗತಿಗಳ ಸಂಖ್ಯೆ 330 ಕ್ಕಿಂತ ಹೆಚ್ಚಿಲ್ಲ. ಆದರೆ ಕೆಲವು ತರಗತಿಗಳಿಗೆ ನೀವು 330 ಕ್ಕಿಂತ ಕಡಿಮೆ ಮುನ್ಸೂಚಕರನ್ನು ಹೊಂದಿರುತ್ತೀರಿ. ಸರಿ, ನಾವು ಟಾಪ್ 2 ಮತ್ತು ಟಾಪ್ 3 ರ ಪ್ರಕಾರವೂ ವಿಂಗಡಿಸೋಣ , ಮತ್ತು ನಾವು ಅಭ್ಯರ್ಥಿಗಳನ್ನು ಸಹ ಆಯ್ಕೆ ಮಾಡುತ್ತೇವೆ.

ನಮ್ಮ ಸಮತೋಲನವು ಮೊದಲ ಸ್ಥಾನದ ಸಮತೋಲನದಿಂದ ಹೇಗೆ ಭಿನ್ನವಾಗಿದೆ? ಅವರು ಪುನರಾವರ್ತನೆಯ ವಿಧಾನವನ್ನು ಬಳಸಿದರು, ಹೆಚ್ಚು ಜನಪ್ರಿಯ ವರ್ಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ ಮತ್ತು ಆ ವರ್ಗವು ಹೆಚ್ಚು ಜನಪ್ರಿಯವಾಗದವರೆಗೆ ಆ ವರ್ಗದ ಸಂಭವನೀಯತೆಯನ್ನು ಕೆಲವು ಸಣ್ಣ ಸಂಖ್ಯೆಗಳಿಂದ ಕಡಿಮೆ ಮಾಡಿದರು. ನಾವು ಮುಂದಿನ ಅತ್ಯಂತ ಜನಪ್ರಿಯ ತರಗತಿಯನ್ನು ತೆಗೆದುಕೊಂಡಿದ್ದೇವೆ. ಆದ್ದರಿಂದ ಅವರು ಎಲ್ಲಾ ವರ್ಗಗಳ ಸಂಖ್ಯೆಯು ಸಮಾನವಾಗುವವರೆಗೆ ಅವುಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುವುದನ್ನು ಮುಂದುವರೆಸಿದರು.

ಪ್ರತಿಯೊಬ್ಬರೂ ರೈಲು ನೆಟ್‌ವರ್ಕ್‌ಗಳಿಗೆ ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್ ಒನ್ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತಾರೆ, ಆದರೆ ಎಲ್ಲರೂ ಸಮತೋಲನವನ್ನು ಬಳಸಲಿಲ್ಲ. ಸಮತೋಲನವನ್ನು ಬಳಸಿಕೊಂಡು, ನೀವು ಚಿನ್ನಕ್ಕೆ ಹೋಗಬಹುದು, ಮತ್ತು ನೀವು ಅದೃಷ್ಟವಂತರಾಗಿದ್ದರೆ, ನಂತರ ಹಣಕ್ಕೆ ಹೋಗಬಹುದು.

ದಿನಾಂಕವನ್ನು ಪೂರ್ವಭಾವಿಯಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು ಹೇಗೆ? ಪ್ರತಿಯೊಬ್ಬರೂ ದಿನಾಂಕವನ್ನು ಪೂರ್ವ-ಸಂಸ್ಕರಿಸಿದ್ದಾರೆ, ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್, ಅದೇ ರೀತಿಯಲ್ಲಿ - ಕರಕುಶಲ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ತಯಾರಿಸುವುದು, ವಿಭಿನ್ನ ಸ್ಟ್ರೋಕ್ ಬಣ್ಣಗಳೊಂದಿಗೆ ಸಮಯವನ್ನು ಎನ್ಕೋಡ್ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುವುದು ಇತ್ಯಾದಿ. 8 ನೇ ಸ್ಥಾನವನ್ನು ಪಡೆದ ಅಲೆಕ್ಸಿ ನೊಜ್ಡ್ರಿನ್-ಪ್ಲೋಟ್ನಿಟ್ಸ್ಕಿ ಅವರು ಮಾತನಾಡಿದರು.

ಕೈಬರಹದ ರೇಖಾಚಿತ್ರಗಳ ವರ್ಗೀಕರಣ. Yandex ನಲ್ಲಿ ವರದಿ ಮಾಡಿ

ಅವನು ಅದನ್ನು ವಿಭಿನ್ನವಾಗಿ ಮಾಡಿದನು. ನಿಮ್ಮ ಈ ಎಲ್ಲಾ ಕರಕುಶಲ ವೈಶಿಷ್ಟ್ಯಗಳು ಕೆಲಸ ಮಾಡುವುದಿಲ್ಲ, ನೀವು ಅದನ್ನು ಮಾಡಬೇಕಾಗಿಲ್ಲ, ನಿಮ್ಮ ನೆಟ್‌ವರ್ಕ್ ಇದೆಲ್ಲವನ್ನೂ ಸ್ವತಃ ಕಲಿಯಬೇಕು ಎಂದು ಹೇಳಿದರು. ಮತ್ತು ಬದಲಾಗಿ, ಅವರು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪೂರ್ವಭಾವಿಯಾಗಿ ಸಂಸ್ಕರಿಸಿದ ಕಲಿಕೆಯ ಮಾಡ್ಯೂಲ್‌ಗಳೊಂದಿಗೆ ಬಂದರು. ಅವರು ಪೂರ್ವ ಸಂಸ್ಕರಣೆ ಮಾಡದೆ ಮೂಲ ಡೇಟಾವನ್ನು ಎಸೆದರು - ಪಾಯಿಂಟ್ ಕಕ್ಷೆಗಳು ಮತ್ತು ಸಮಯಗಳು.

ನಂತರ ಅವರು ನಿರ್ದೇಶಾಂಕಗಳ ಆಧಾರದ ಮೇಲೆ ವ್ಯತ್ಯಾಸವನ್ನು ತೆಗೆದುಕೊಂಡರು ಮತ್ತು ಸಮಯದ ಆಧಾರದ ಮೇಲೆ ಎಲ್ಲವನ್ನೂ ಸರಾಸರಿ ಮಾಡಿದರು. ಮತ್ತು ಅವರು ದೀರ್ಘವಾದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನೊಂದಿಗೆ ಬಂದರು. 1xn ಗಾತ್ರದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ಪಡೆಯಲು ಅವರು 64D ಕನ್ವಲ್ಯೂಷನ್ ಅನ್ನು ಹಲವಾರು ಬಾರಿ ಅನ್ವಯಿಸಿದರು, ಅಲ್ಲಿ n ಒಟ್ಟು ಅಂಕಗಳ ಸಂಖ್ಯೆ, ಮತ್ತು 64 ಅನ್ನು ಯಾವುದೇ ಕನ್ವಲ್ಯೂಷನಲ್ ನೆಟ್‌ವರ್ಕ್‌ನ ಪದರಕ್ಕೆ ಫೀಡ್ ಮಾಡಲು 64 ಅನ್ನು ತಯಾರಿಸಲಾಗುತ್ತದೆ, ಇದು ಚಾನಲ್‌ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಸ್ವೀಕರಿಸುತ್ತದೆ. - 64. ಅವರು 64xn ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ಪಡೆದರು, ನಂತರ ಇದರಿಂದ ಕೆಲವು ಗಾತ್ರದ ಟೆನ್ಸರ್ ಅನ್ನು ರಚಿಸುವುದು ಅಗತ್ಯವಾಗಿತ್ತು ಇದರಿಂದ ಚಾನಲ್‌ಗಳ ಸಂಖ್ಯೆ 0 ಕ್ಕೆ ಸಮನಾಗಿರುತ್ತದೆ. ಅವರು 32 ರಿಂದ 32 ರವರೆಗಿನ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ X, Y ಎಲ್ಲಾ ಬಿಂದುಗಳನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿದರು. 32x32 ಗಾತ್ರದ ಟೆನ್ಸರ್. ಅವರು 32x64 ಅನ್ನು ಏಕೆ ಬಯಸಿದ್ದರು ಎಂದು ನನಗೆ ತಿಳಿದಿಲ್ಲ, ಅದು ಆ ರೀತಿಯಲ್ಲಿ ಸಂಭವಿಸಿದೆ. ಮತ್ತು ಈ ನಿರ್ದೇಶಾಂಕದಲ್ಲಿ ಅವರು 32xn ಗಾತ್ರದ ಈ ಮ್ಯಾಟ್ರಿಕ್ಸ್‌ನ ತುಣುಕನ್ನು ಇರಿಸಿದರು. ಆದ್ದರಿಂದ ಇದು ಕೇವಲ 32x64xXNUMX ಟೆನ್ಸರ್‌ನೊಂದಿಗೆ ಕೊನೆಗೊಂಡಿತು ಮತ್ತು ನಿಮ್ಮ ಕನ್ವಲ್ಯೂಷನಲ್ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ಗೆ ನೀವು ಮತ್ತಷ್ಟು ಸೇರಿಸಬಹುದು. ನಾನು ಹೇಳಲು ಬಯಸಿದ್ದು ಇಷ್ಟೇ.

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ