ಕೆಲವು ತಿಂಗಳ ಹಿಂದೆ, Google ನಿಂದ ನಮ್ಮ ಸಹೋದ್ಯೋಗಿಗಳು
- ಎಲ್ಲರಿಗು ನಮಸ್ಖರ! ನನ್ನ ಹೆಸರು ರೋಮಾ ವ್ಲಾಸೊವ್, ಇಂದು ನಾನು ನಿಮಗೆ ತ್ವರಿತ, ಡ್ರಾ ಬಗ್ಗೆ ಹೇಳುತ್ತೇನೆ! ಡೂಡಲ್ ಗುರುತಿಸುವಿಕೆ ಸವಾಲು.
ನಮ್ಮ ತಂಡದಲ್ಲಿ ಐದು ಜನರಿದ್ದರು. ನಾನು ವಿಲೀನದ ಗಡುವಿನ ಮೊದಲು ಸೇರಿದೆ. ನಾವು ದುರದೃಷ್ಟವಂತರು, ನಾವು ಸ್ವಲ್ಪ ಅಲುಗಾಡಿದ್ದೇವೆ, ಆದರೆ ನಾವು ಹಣದ ಸ್ಥಾನದಿಂದ ಅಲುಗಾಡಿದ್ದೇವೆ ಮತ್ತು ಅವರು ಚಿನ್ನದ ಸ್ಥಾನದಿಂದ ಅಲುಗಾಡಿದರು. ಮತ್ತು ನಾವು ಗೌರವಾನ್ವಿತ ನಾಲ್ಕನೇ ಸ್ಥಾನವನ್ನು ಪಡೆದುಕೊಂಡಿದ್ದೇವೆ.
(ಸ್ಪರ್ಧೆಯ ಸಮಯದಲ್ಲಿ, ತಂಡಗಳು ತಮ್ಮನ್ನು ರೇಟಿಂಗ್ನಲ್ಲಿ ಗಮನಿಸಿದವು, ಇದು ಪ್ರಸ್ತಾವಿತ ಡೇಟಾ ಸೆಟ್ನ ಒಂದು ಭಾಗದಲ್ಲಿ ತೋರಿಸಲಾದ ಫಲಿತಾಂಶಗಳ ಆಧಾರದ ಮೇಲೆ ರೂಪುಗೊಂಡಿತು. ಅಂತಿಮ ರೇಟಿಂಗ್, ಪ್ರತಿಯಾಗಿ, ಡೇಟಾಸೆಟ್ನ ಇನ್ನೊಂದು ಭಾಗದಲ್ಲಿ ರಚಿಸಲಾಗಿದೆ. ಇದನ್ನು ಹೀಗೆ ಮಾಡಲಾಗುತ್ತದೆ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಭಾಗವಹಿಸುವವರು ತಮ್ಮ ಅಲ್ಗಾರಿದಮ್ಗಳನ್ನು ನಿರ್ದಿಷ್ಟ ಡೇಟಾಗೆ ಹೊಂದಿಸುವುದಿಲ್ಲ. ಆದ್ದರಿಂದ, ಫೈನಲ್ನಲ್ಲಿ, ರೇಟಿಂಗ್ಗಳ ನಡುವೆ ಬದಲಾಯಿಸುವಾಗ, ಸ್ಥಾನಗಳು ಸ್ವಲ್ಪ ಅಲುಗಾಡುತ್ತವೆ (ಇಂಗ್ಲಿಷ್ನಿಂದ ಶೇಕ್ ಅಪ್ - ಮಿಶ್ರಣ ಮಾಡಲು): ಇತರ ಡೇಟಾದಲ್ಲಿ, ಫಲಿತಾಂಶವು ಹೊರಹೊಮ್ಮಬಹುದು ವಿಭಿನ್ನವಾಗಿರಲು, ರೋಮನ್ ತಂಡವು ಮೊದಲ ಮೂರರಲ್ಲಿ ಮೊದಲ ಸ್ಥಾನದಲ್ಲಿತ್ತು. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಮೊದಲ ಮೂರು ಸ್ಥಾನಗಳು ಹಣ, ವಿತ್ತೀಯ ರೇಟಿಂಗ್ ವಲಯವಾಗಿದೆ, ಏಕೆಂದರೆ ಮೊದಲ ಮೂರು ಸ್ಥಾನಗಳಿಗೆ ಮಾತ್ರ ನಗದು ಬಹುಮಾನವನ್ನು ನೀಡಲಾಯಿತು. ಶೇಕ್-ಅಪ್ ನಂತರ, ತಂಡವು ಈಗಾಗಲೇ ನಾಲ್ಕನೇ ಸ್ಥಾನ, ಅದೇ ರೀತಿಯಲ್ಲಿ, ಇತರ ತಂಡವು ಗೆಲುವು, ಚಿನ್ನದ ಸ್ಥಾನವನ್ನು ಕಳೆದುಕೊಂಡಿತು. - ಎಡ್.)
ಎವ್ಗೆನಿ ಬಾಬಖ್ನಿನ್ ಗ್ರ್ಯಾಂಡ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ಇವಾನ್ ಸೊಸಿನ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ರೋಮನ್ ಸೊಲೊವಿವ್ ಗ್ರ್ಯಾಂಡ್ ಮಾಸ್ಟರ್ ಆಗಿ ಉಳಿದರು, ಅಲೆಕ್ಸ್ ಪರಿನೋವ್ ಮಾಸ್ಟರ್ ಪಡೆದರು, ನಾನು ಪರಿಣಿತನಾಗಿದ್ದೇನೆ ಮತ್ತು ಈಗ ನಾನು ಈಗಾಗಲೇ ಮಾಸ್ಟರ್ ಆಗಿದ್ದೇನೆ ಎಂಬ ಸ್ಪರ್ಧೆಯು ಗಮನಾರ್ಹವಾಗಿದೆ.
ಈ ಕ್ವಿಕ್, ಡ್ರಾ ಎಂದರೇನು? ಇದು Google ನಿಂದ ಸೇವೆಯಾಗಿದೆ. AI ಅನ್ನು ಜನಪ್ರಿಯಗೊಳಿಸುವ ಗುರಿಯನ್ನು Google ಹೊಂದಿತ್ತು ಮತ್ತು ಈ ಸೇವೆಯೊಂದಿಗೆ ನರ ನೆಟ್ವರ್ಕ್ಗಳು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ತೋರಿಸಲು ಬಯಸಿದೆ. ನೀವು ಅಲ್ಲಿಗೆ ಹೋಗಿ, ಲೆಟ್ಸ್ ಡ್ರಾ ಅನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಿಮಗೆ ಹೇಳಲಾದ ಹೊಸ ಪುಟವು ಪಾಪ್ ಅಪ್ ಆಗುತ್ತದೆ: ಅಂಕುಡೊಂಕು ಎಳೆಯಿರಿ, ಇದನ್ನು ಮಾಡಲು ನಿಮಗೆ 20 ಸೆಕೆಂಡುಗಳಿವೆ. ನೀವು 20 ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಅಂಕುಡೊಂಕು ಸೆಳೆಯಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ, ಉದಾಹರಣೆಗೆ, ಇಲ್ಲಿ. ನೀವು ಯಶಸ್ವಿಯಾದರೆ, ನೆಟ್ವರ್ಕ್ ಇದು ಅಂಕುಡೊಂಕು ಎಂದು ಹೇಳುತ್ತದೆ ಮತ್ತು ನೀವು ಮುಂದುವರಿಯಿರಿ. ಅಂತಹ ಚಿತ್ರಗಳು ಕೇವಲ ಆರು ಇವೆ.
ನೀವು ಚಿತ್ರಿಸಿದುದನ್ನು ಗುರುತಿಸಲು Google ನ ನೆಟ್ವರ್ಕ್ ವಿಫಲವಾದರೆ, ಕಾರ್ಯದ ಮೇಲೆ ಅಡ್ಡ ಹಾಕಲಾಗುತ್ತದೆ. ನೆಟ್ವರ್ಕ್ನಿಂದ ಡ್ರಾಯಿಂಗ್ ಗುರುತಿಸಲ್ಪಟ್ಟಿದೆಯೇ ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದು ಭವಿಷ್ಯದಲ್ಲಿ ಇದರ ಅರ್ಥವೇನೆಂದು ನಂತರ ನಾನು ನಿಮಗೆ ಹೇಳುತ್ತೇನೆ.
ಈ ಸೇವೆಯು ಸಾಕಷ್ಟು ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಬಳಕೆದಾರರನ್ನು ಸಂಗ್ರಹಿಸಿದೆ ಮತ್ತು ಬಳಕೆದಾರರು ಚಿತ್ರಿಸಿದ ಎಲ್ಲಾ ಚಿತ್ರಗಳನ್ನು ಲಾಗ್ ಮಾಡಲಾಗಿದೆ.
ನಾವು ಸುಮಾರು 50 ಮಿಲಿಯನ್ ಚಿತ್ರಗಳನ್ನು ಸಂಗ್ರಹಿಸುವಲ್ಲಿ ಯಶಸ್ವಿಯಾಗಿದ್ದೇವೆ. ಇದರಿಂದ ನಮ್ಮ ಸ್ಪರ್ಧೆಗೆ ರೈಲು ಮತ್ತು ಪರೀಕ್ಷಾ ದಿನಾಂಕ ರೂಪುಗೊಂಡಿತು. ಮೂಲಕ, ಪರೀಕ್ಷೆಯಲ್ಲಿನ ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಯನ್ನು ಒಂದು ಕಾರಣಕ್ಕಾಗಿ ದಪ್ಪದಲ್ಲಿ ಹೈಲೈಟ್ ಮಾಡಲಾಗುತ್ತದೆ. ಸ್ವಲ್ಪ ಸಮಯದ ನಂತರ ನಾನು ಅವರ ಬಗ್ಗೆ ಹೇಳುತ್ತೇನೆ.
ಡೇಟಾ ಸ್ವರೂಪವು ಈ ಕೆಳಗಿನಂತಿತ್ತು. ಇವು ಕೇವಲ RGB ಚಿತ್ರಗಳಲ್ಲ, ಆದರೆ, ಸ್ಥೂಲವಾಗಿ ಹೇಳುವುದಾದರೆ, ಬಳಕೆದಾರರು ಮಾಡಿದ ಎಲ್ಲದರ ಲಾಗ್. ಪದವು ನಮ್ಮ ಗುರಿಯಾಗಿದೆ, ಡೂಡಲ್ನ ಲೇಖಕರು ಎಲ್ಲಿಂದ ಬಂದವರು ಕಂಟ್ರಿಕೋಡ್, ಟೈಮ್ಸ್ಟ್ಯಾಂಪ್ ಸಮಯ. ಗುರುತಿಸಲಾದ ಲೇಬಲ್ Google ನಿಂದ ಚಿತ್ರವನ್ನು ನೆಟ್ವರ್ಕ್ ಗುರುತಿಸಿದೆಯೇ ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ. ಮತ್ತು ರೇಖಾಚಿತ್ರವು ಒಂದು ಅನುಕ್ರಮವಾಗಿದೆ, ಬಳಕೆದಾರರು ಅಂಕಗಳೊಂದಿಗೆ ಸೆಳೆಯುವ ವಕ್ರರೇಖೆಯ ಅಂದಾಜು. ಮತ್ತು ಸಮಯಗಳು. ಚಿತ್ರ ಬಿಡಿಸುವ ಆರಂಭದ ಸಮಯ ಇದು.
ಡೇಟಾವನ್ನು ಎರಡು ಸ್ವರೂಪಗಳಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ. ಇದು ಮೊದಲ ಸ್ವರೂಪವಾಗಿದೆ, ಮತ್ತು ಎರಡನೆಯದನ್ನು ಸರಳೀಕರಿಸಲಾಗಿದೆ. ಅವರು ಅಲ್ಲಿಂದ ಸಮಯವನ್ನು ಕಡಿತಗೊಳಿಸಿದರು ಮತ್ತು ಈ ಬಿಂದುಗಳ ಗುಂಪನ್ನು ಚಿಕ್ಕ ಅಂಕಗಳೊಂದಿಗೆ ಅಂದಾಜು ಮಾಡಿದರು. ಇದಕ್ಕಾಗಿ ಅವರು ಬಳಸಿದರು
ಡೇಟಾವನ್ನು ಈ ಕೆಳಗಿನಂತೆ ವಿತರಿಸಲಾಗಿದೆ. ಎಲ್ಲವೂ ಏಕರೂಪವಾಗಿದೆ, ಆದರೆ ಕೆಲವು ಔಟ್ಲೈಯರ್ಗಳಿವೆ. ನಾವು ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಿದಾಗ, ನಾವು ಅದನ್ನು ನೋಡಲಿಲ್ಲ. ಮುಖ್ಯ ವಿಷಯವೆಂದರೆ ನಿಜವಾಗಿಯೂ ಕಡಿಮೆ ಇರುವ ಯಾವುದೇ ತರಗತಿಗಳು ಇರಲಿಲ್ಲ, ನಾವು ತೂಕದ ಮಾದರಿಗಳು ಮತ್ತು ಡೇಟಾ ಓವರ್ಸ್ಯಾಂಪ್ಲಿಂಗ್ ಮಾಡಬೇಕಾಗಿಲ್ಲ.
ಚಿತ್ರಗಳು ಹೇಗಿದ್ದವು? ಇದು "ಏರೋಪ್ಲೇನ್" ವರ್ಗ ಮತ್ತು ಅದರ ಉದಾಹರಣೆಗಳು ಗುರುತಿಸಲ್ಪಟ್ಟ ಮತ್ತು ಗುರುತಿಸದ ಲೇಬಲ್ಗಳೊಂದಿಗೆ. ಅವರ ಅನುಪಾತವು ಎಲ್ಲೋ 1 ರಿಂದ 9 ರಷ್ಟಿತ್ತು. ನೀವು ನೋಡುವಂತೆ, ಡೇಟಾವು ಸಾಕಷ್ಟು ಗದ್ದಲದಂತಿದೆ. ಇದು ವಿಮಾನ ಎಂದು ನಾನು ಊಹಿಸುತ್ತೇನೆ. ನೀವು ಗುರುತಿಸಲಾಗಿಲ್ಲ ಎಂದು ನೋಡಿದರೆ, ಹೆಚ್ಚಿನ ಸಂದರ್ಭಗಳಲ್ಲಿ ಅದು ಕೇವಲ ಶಬ್ದವಾಗಿದೆ. ಯಾರೋ ಒಬ್ಬರು "ಏರೋಪ್ಲೇನ್" ಎಂದು ಬರೆಯಲು ಪ್ರಯತ್ನಿಸಿದರು, ಆದರೆ ಸ್ಪಷ್ಟವಾಗಿ ಫ್ರೆಂಚ್ನಲ್ಲಿ.
ಹೆಚ್ಚಿನ ಭಾಗವಹಿಸುವವರು ಸರಳವಾಗಿ ಗ್ರಿಡ್ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರು, ಈ ಸಾಲುಗಳ ಅನುಕ್ರಮದಿಂದ ಡೇಟಾವನ್ನು RGB ಚಿತ್ರಗಳಾಗಿ ಚಿತ್ರಿಸಿದರು ಮತ್ತು ಅವುಗಳನ್ನು ನೆಟ್ವರ್ಕ್ಗೆ ಎಸೆದರು. ನಾನು ಸರಿಸುಮಾರು ಅದೇ ರೀತಿಯಲ್ಲಿ ಚಿತ್ರಿಸಿದ್ದೇನೆ: ನಾನು ಬಣ್ಣಗಳ ಪ್ಯಾಲೆಟ್ ಅನ್ನು ತೆಗೆದುಕೊಂಡೆ, ಮೊದಲ ರೇಖೆಯನ್ನು ಒಂದು ಬಣ್ಣದಿಂದ ಚಿತ್ರಿಸಿದೆ, ಅದು ಈ ಪ್ಯಾಲೆಟ್ನ ಆರಂಭದಲ್ಲಿದೆ, ಇನ್ನೊಂದು ಕೊನೆಯ ಸಾಲು, ಅದು ಪ್ಯಾಲೆಟ್ನ ಕೊನೆಯಲ್ಲಿ ಮತ್ತು ಅವುಗಳ ನಡುವೆ ಇತ್ತು. ನಾನು ಈ ಪ್ಯಾಲೆಟ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಎಲ್ಲೆಡೆ ಇಂಟರ್ಪೋಲೇಟ್ ಮಾಡಿದ್ದೇನೆ. ಅಂದಹಾಗೆ, ಇದು ನೀವು ಮೊದಲ ಸ್ಲೈಡ್ನಲ್ಲಿ ಚಿತ್ರಿಸುವುದಕ್ಕಿಂತ ಉತ್ತಮ ಫಲಿತಾಂಶವನ್ನು ನೀಡಿತು - ಕೇವಲ ಕಪ್ಪು ಬಣ್ಣದಲ್ಲಿ.
ಇತರ ತಂಡದ ಸದಸ್ಯರು, ಉದಾಹರಣೆಗೆ ಇವಾನ್ ಸೊಸಿನ್, ರೇಖಾಚಿತ್ರಕ್ಕೆ ಸ್ವಲ್ಪ ವಿಭಿನ್ನ ವಿಧಾನಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿದರು. ಒಂದು ಚಾನೆಲ್ನೊಂದಿಗೆ ಅವರು ಸರಳವಾಗಿ ಬೂದು ಚಿತ್ರವನ್ನು ಚಿತ್ರಿಸಿದರು, ಇನ್ನೊಂದು ಚಾನಲ್ನೊಂದಿಗೆ ಅವರು 32 ರಿಂದ 255 ರವರೆಗಿನ ಗ್ರೇಡಿಯಂಟ್ನೊಂದಿಗೆ ಪ್ರತಿ ಸ್ಟ್ರೋಕ್ ಅನ್ನು ಮೊದಲಿನಿಂದ ಕೊನೆಯವರೆಗೆ ಎಳೆದರು ಮತ್ತು ಮೂರನೇ ಚಾನಲ್ನೊಂದಿಗೆ ಅವರು 32 ರಿಂದ 255 ರವರೆಗಿನ ಎಲ್ಲಾ ಸ್ಟ್ರೋಕ್ಗಳ ಮೇಲೆ ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಚಿತ್ರಿಸಿದರು.
ಮತ್ತೊಂದು ಕುತೂಹಲಕಾರಿ ವಿಷಯವೆಂದರೆ ಅಲೆಕ್ಸ್ ಪ್ಯಾರಿನೋವ್ ಅವರು ದೇಶದ ಕೋಡ್ ಬಳಸಿ ನೆಟ್ವರ್ಕ್ಗೆ ಮಾಹಿತಿಯನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡಿದ್ದಾರೆ.
ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಬಳಸಲಾದ ಮೆಟ್ರಿಕ್ ಸರಾಸರಿ ಸರಾಸರಿ ನಿಖರತೆಯಾಗಿದೆ. ಸ್ಪರ್ಧೆಗಾಗಿ ಈ ಮೆಟ್ರಿಕ್ನ ಮೂಲತತ್ವ ಏನು? ನೀವು ಮೂರು ಮುನ್ಸೂಚನೆಗಳನ್ನು ನೀಡಬಹುದು, ಮತ್ತು ಈ ಮೂರರಲ್ಲಿ ಸರಿಯಾದ ಮುನ್ಸೂಚನೆ ಇಲ್ಲದಿದ್ದರೆ, ನೀವು 0 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಸರಿಯಾದ ಒಂದು ಇದ್ದರೆ, ಅದರ ಕ್ರಮವನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳಲಾಗುತ್ತದೆ. ಮತ್ತು ಗುರಿ ಫಲಿತಾಂಶವನ್ನು ನಿಮ್ಮ ಭವಿಷ್ಯವಾಣಿಯ ಕ್ರಮದಿಂದ ಭಾಗಿಸಿ 1 ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ಮೂರು ಮುನ್ಸೂಚಕಗಳನ್ನು ಮಾಡಿದ್ದೀರಿ, ಮತ್ತು ಸರಿಯಾದದು ಮೊದಲನೆಯದು, ನಂತರ ನೀವು 1 ರಿಂದ 1 ಭಾಗಿಸಿ ಮತ್ತು 1 ಅನ್ನು ಪಡೆದುಕೊಳ್ಳಿ. ಪ್ರಿಡಿಕ್ಟರ್ ಸರಿಯಾಗಿದ್ದರೆ ಮತ್ತು ಅದರ ಕ್ರಮವು 2 ಆಗಿದ್ದರೆ, ನಂತರ 1 ರಿಂದ 2 ರಿಂದ ಭಾಗಿಸಿ, ನೀವು 0,5 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಸರಿ, ಇತ್ಯಾದಿ.
ಡೇಟಾ ಪ್ರಿಪ್ರೊಸೆಸಿಂಗ್ನೊಂದಿಗೆ - ಚಿತ್ರಗಳನ್ನು ಹೇಗೆ ಸೆಳೆಯುವುದು ಮತ್ತು ಹೀಗೆ - ನಾವು ಸ್ವಲ್ಪ ನಿರ್ಧರಿಸಿದ್ದೇವೆ. ನಾವು ಯಾವ ವಾಸ್ತುಶಿಲ್ಪಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ? ನಾವು PNASNet, SENet ನಂತಹ ಫ್ಯಾಟ್ ಆರ್ಕಿಟೆಕ್ಚರ್ಗಳನ್ನು ಬಳಸಲು ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ ಮತ್ತು SE-Res-NeXt ನಂತಹ ಈಗಾಗಲೇ ಕ್ಲಾಸಿಕ್ ಆರ್ಕಿಟೆಕ್ಚರ್ಗಳನ್ನು ಬಳಸಲು ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ, ಅವುಗಳು ಹೆಚ್ಚು ಹೊಸ ಸ್ಪರ್ಧೆಗಳನ್ನು ಪ್ರವೇಶಿಸುತ್ತಿವೆ. ResNet ಮತ್ತು DenseNet ಸಹ ಇದ್ದವು.
ನಾವು ಇದನ್ನು ಹೇಗೆ ಕಲಿಸಿದ್ದೇವೆ? ನಾವು ತೆಗೆದುಕೊಂಡ ಎಲ್ಲಾ ಮಾದರಿಗಳು ಇಮೇಜ್ನೆಟ್ನಲ್ಲಿ ಪೂರ್ವ ತರಬೇತಿ ಪಡೆದವು. ಸಾಕಷ್ಟು ಡೇಟಾ ಇದ್ದರೂ, 50 ಮಿಲಿಯನ್ ಚಿತ್ರಗಳು, ಆದರೆ ಇನ್ನೂ, ನೀವು ಇಮೇಜ್ನೆಟ್ನಲ್ಲಿ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ನೆಟ್ವರ್ಕ್ ಅನ್ನು ತೆಗೆದುಕೊಂಡರೆ, ನೀವು ಅದನ್ನು ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡುವುದಕ್ಕಿಂತ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ತೋರಿಸಿದೆ.
ನಾವು ಯಾವ ಬೋಧನಾ ತಂತ್ರಗಳನ್ನು ಬಳಸಿದ್ದೇವೆ? ಇದು ಬೆಚ್ಚಗಿನ ಪುನರಾರಂಭಗಳೊಂದಿಗೆ ಕೋಸಿಂಗ್ ಅನೆಲಿಂಗ್ ಆಗಿದೆ, ನಾನು ಸ್ವಲ್ಪ ಸಮಯದ ನಂತರ ಮಾತನಾಡುತ್ತೇನೆ. ಇದು ನನ್ನ ಇತ್ತೀಚಿನ ಎಲ್ಲಾ ಸ್ಪರ್ಧೆಗಳಲ್ಲಿ ನಾನು ಬಳಸುವ ತಂತ್ರವಾಗಿದೆ, ಮತ್ತು ಅವರೊಂದಿಗೆ ಉತ್ತಮವಾದ ಕನಿಷ್ಠವನ್ನು ಸಾಧಿಸಲು ಗ್ರಿಡ್ಗಳನ್ನು ಚೆನ್ನಾಗಿ ತರಬೇತಿ ಮಾಡಲು ಇದು ತಿರುಗುತ್ತದೆ.
ಮುಂದೆ ಪ್ರಸ್ಥಭೂಮಿಯಲ್ಲಿ ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆ ಮಾಡಿ. ನೀವು ನೆಟ್ವರ್ಕ್ಗೆ ತರಬೇತಿ ನೀಡಲು ಪ್ರಾರಂಭಿಸಿ, ನಿರ್ದಿಷ್ಟ ಕಲಿಕೆಯ ದರವನ್ನು ಹೊಂದಿಸಿ, ಅದನ್ನು ಕಲಿಸುವುದನ್ನು ಮುಂದುವರಿಸಿ ಮತ್ತು ನಿಮ್ಮ ನಷ್ಟವು ಕ್ರಮೇಣ ಒಂದು ನಿರ್ದಿಷ್ಟ ಮೌಲ್ಯಕ್ಕೆ ಒಮ್ಮುಖವಾಗುತ್ತದೆ. ನೀವು ಇದನ್ನು ಪರಿಶೀಲಿಸಿ, ಉದಾಹರಣೆಗೆ, ಹತ್ತು ಯುಗಗಳವರೆಗೆ ನಷ್ಟವು ಬದಲಾಗಿಲ್ಲ. ನೀವು ನಿಮ್ಮ ಕಲಿಕೆಯ ದರವನ್ನು ಸ್ವಲ್ಪ ಮೌಲ್ಯದಿಂದ ಕಡಿಮೆ ಮಾಡಿ ಮತ್ತು ಕಲಿಕೆಯನ್ನು ಮುಂದುವರಿಸಿ. ಇದು ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಇಳಿಯುತ್ತದೆ, ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಒಮ್ಮುಖವಾಗುತ್ತದೆ, ಮತ್ತು ನೀವು ಮತ್ತೆ ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆಗೊಳಿಸುತ್ತೀರಿ, ಮತ್ತು ಹೀಗೆ, ನಿಮ್ಮ ನೆಟ್ವರ್ಕ್ ಅಂತಿಮವಾಗಿ ಒಮ್ಮುಖವಾಗುವವರೆಗೆ.
ಮುಂದಿನದು ಆಸಕ್ತಿದಾಯಕ ತಂತ್ರವಾಗಿದೆ: ಕಲಿಕೆಯ ದರವನ್ನು ಕೊಳೆಯಬೇಡಿ, ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ಹೆಚ್ಚಿಸಿ. ಅದೇ ಹೆಸರಿನ ಲೇಖನವಿದೆ. ನೀವು ನೆಟ್ವರ್ಕ್ಗೆ ತರಬೇತಿ ನೀಡಿದಾಗ, ನೀವು ಕಲಿಕೆಯ ದರವನ್ನು ಕಡಿಮೆ ಮಾಡಬೇಕಾಗಿಲ್ಲ, ನೀವು ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.
ಈ ತಂತ್ರವನ್ನು ಅಲೆಕ್ಸ್ ಪ್ಯಾರಿನೋವ್ ಬಳಸಿದ್ದಾರೆ. ಅವರು 408 ಕ್ಕೆ ಸಮಾನವಾದ ಬ್ಯಾಚ್ನೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿದರು, ಮತ್ತು ಅವರ ನೆಟ್ವರ್ಕ್ ಕೆಲವು ಪ್ರಸ್ಥಭೂಮಿಯನ್ನು ತಲುಪಿದಾಗ, ಅವರು ಬ್ಯಾಚ್ ಗಾತ್ರವನ್ನು ದ್ವಿಗುಣಗೊಳಿಸಿದರು, ಇತ್ಯಾದಿ.
ವಾಸ್ತವವಾಗಿ, ಅವನ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಯಾವ ಮೌಲ್ಯವನ್ನು ತಲುಪಿದೆ ಎಂದು ನನಗೆ ನೆನಪಿಲ್ಲ, ಆದರೆ ಕುತೂಹಲಕಾರಿ ಸಂಗತಿಯೆಂದರೆ ಅದೇ ತಂತ್ರವನ್ನು ಬಳಸಿದ ತಂಡಗಳು ಕಾಗಲ್ನಲ್ಲಿ ಇದ್ದವು, ಅವುಗಳ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಸುಮಾರು 10000 ಆಗಿತ್ತು. ಅಂದಹಾಗೆ, ಆಳವಾದ ಕಲಿಕೆಗಾಗಿ ಆಧುನಿಕ ಚೌಕಟ್ಟುಗಳು, ಉದಾಹರಣೆಗೆ PyTorch, ಉದಾಹರಣೆಗೆ, ಇದನ್ನು ಬಹಳ ಸುಲಭವಾಗಿ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ನೀವು ನಿಮ್ಮ ಬ್ಯಾಚ್ ಅನ್ನು ರಚಿಸುತ್ತೀರಿ ಮತ್ತು ಅದನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ನೆಟ್ವರ್ಕ್ಗೆ ಸಲ್ಲಿಸಿ, ಆದರೆ ಅದನ್ನು ಭಾಗಗಳಾಗಿ ವಿಂಗಡಿಸಿ ಇದರಿಂದ ಅದು ನಿಮ್ಮ ವೀಡಿಯೊ ಕಾರ್ಡ್ಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ, ಗ್ರೇಡಿಯಂಟ್ಗಳನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ ಮತ್ತು ನೀವು ಸಂಪೂರ್ಣ ಬ್ಯಾಚ್ಗೆ ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಲೆಕ್ಕ ಹಾಕಿದ ನಂತರ, ನವೀಕರಿಸಿ ತೂಕಗಳು.
ಅಂದಹಾಗೆ, ಈ ಸ್ಪರ್ಧೆಯಲ್ಲಿ ದೊಡ್ಡ ಬ್ಯಾಚ್ ಗಾತ್ರಗಳನ್ನು ಇನ್ನೂ ಸೇರಿಸಲಾಗಿದೆ, ಏಕೆಂದರೆ ಡೇಟಾವು ಸಾಕಷ್ಟು ಗದ್ದಲದಂತಿತ್ತು ಮತ್ತು ದೊಡ್ಡ ಬ್ಯಾಚ್ ಗಾತ್ರವು ಗ್ರೇಡಿಯಂಟ್ ಅನ್ನು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ಅಂದಾಜು ಮಾಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
ಸ್ಯೂಡೋ-ಲೇಬಲಿಂಗ್ ಅನ್ನು ಸಹ ಬಳಸಲಾಗುತ್ತಿತ್ತು, ಹೆಚ್ಚಾಗಿ ರೋಮನ್ ಸೊಲೊವೀವ್ ಬಳಸಿದರು. ಅವರು ಪರೀಕ್ಷೆಯಿಂದ ಅರ್ಧದಷ್ಟು ಡೇಟಾವನ್ನು ಬ್ಯಾಚ್ಗಳಲ್ಲಿ ಸ್ಯಾಂಪಲ್ ಮಾಡಿದರು ಮತ್ತು ಅಂತಹ ಬ್ಯಾಚ್ಗಳಲ್ಲಿ ಗ್ರಿಡ್ಗೆ ತರಬೇತಿ ನೀಡಿದರು.
ಚಿತ್ರಗಳ ಗಾತ್ರವು ಮುಖ್ಯವಾದುದು, ಆದರೆ ನೀವು ಸಾಕಷ್ಟು ಡೇಟಾವನ್ನು ಹೊಂದಿದ್ದೀರಿ, ನೀವು ದೀರ್ಘಕಾಲದವರೆಗೆ ತರಬೇತಿ ನೀಡಬೇಕಾಗಿದೆ ಮತ್ತು ನಿಮ್ಮ ಚಿತ್ರದ ಗಾತ್ರವು ಸಾಕಷ್ಟು ದೊಡ್ಡದಾಗಿದ್ದರೆ, ನೀವು ಬಹಳ ಸಮಯದವರೆಗೆ ತರಬೇತಿ ನೀಡುತ್ತೀರಿ. ಆದರೆ ಇದು ನಿಮ್ಮ ಅಂತಿಮ ವರ್ಗೀಕರಣದ ಗುಣಮಟ್ಟಕ್ಕೆ ಹೆಚ್ಚಿನದನ್ನು ಸೇರಿಸಲಿಲ್ಲ, ಆದ್ದರಿಂದ ಕೆಲವು ರೀತಿಯ ವ್ಯಾಪಾರವನ್ನು ಬಳಸುವುದು ಯೋಗ್ಯವಾಗಿದೆ. ಮತ್ತು ನಾವು ಗಾತ್ರದಲ್ಲಿ ತುಂಬಾ ದೊಡ್ಡದಲ್ಲದ ಚಿತ್ರಗಳನ್ನು ಮಾತ್ರ ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ.
ಇದೆಲ್ಲ ಕಲಿತಿದ್ದು ಹೇಗೆ? ಮೊದಲಿಗೆ, ಸಣ್ಣ ಗಾತ್ರದ ಚಿತ್ರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲಾಗಿದೆ, ಹಲವಾರು ಯುಗಗಳನ್ನು ಅವುಗಳ ಮೇಲೆ ನಡೆಸಲಾಯಿತು, ಇದು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ತೆಗೆದುಕೊಂಡಿತು. ನಂತರ ದೊಡ್ಡ ಗಾತ್ರದ ಚಿತ್ರಗಳನ್ನು ನೀಡಲಾಯಿತು, ನೆಟ್ವರ್ಕ್ಗೆ ತರಬೇತಿ ನೀಡಲಾಯಿತು, ನಂತರ ಇನ್ನೂ ಹೆಚ್ಚು, ಇನ್ನಷ್ಟು, ಆದ್ದರಿಂದ ಅದನ್ನು ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡದಂತೆ ಮತ್ತು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ವ್ಯರ್ಥ ಮಾಡಬೇಡಿ.
ಆಪ್ಟಿಮೈಜರ್ಗಳ ಬಗ್ಗೆ. ನಾವು SGD ಮತ್ತು ಆಡಮ್ ಅನ್ನು ಬಳಸಿದ್ದೇವೆ. ಈ ರೀತಿಯಾಗಿ ಒಂದೇ ಮಾದರಿಯನ್ನು ಪಡೆಯಲು ಸಾಧ್ಯವಾಯಿತು, ಇದು ಸಾರ್ವಜನಿಕ ಲೀಡರ್ಬೋರ್ಡ್ನಲ್ಲಿ 0,941-0,946 ವೇಗವನ್ನು ನೀಡಿತು, ಇದು ಸಾಕಷ್ಟು ಉತ್ತಮವಾಗಿದೆ.
ನೀವು ಕೆಲವು ರೀತಿಯಲ್ಲಿ ಮಾದರಿಗಳನ್ನು ಸಂಯೋಜಿಸಿದರೆ, ನೀವು ಎಲ್ಲೋ ಸುಮಾರು 0,951 ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ನೀವು ಇನ್ನೂ ಒಂದು ತಂತ್ರವನ್ನು ಬಳಸಿದರೆ, ನಾವು ಪಡೆದಂತೆಯೇ ನೀವು ಸಾರ್ವಜನಿಕ ಮಂಡಳಿಯಲ್ಲಿ 0,954 ಅಂತಿಮ ಸ್ಕೋರ್ ಅನ್ನು ಪಡೆಯುತ್ತೀರಿ. ಆದರೆ ನಂತರ ಹೆಚ್ಚು. ಮುಂದೆ ನಾವು ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ಜೋಡಿಸಿದ್ದೇವೆ ಮತ್ತು ಅಂತಹ ಅಂತಿಮ ವೇಗವನ್ನು ಸಾಧಿಸಲು ನಾವು ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತಿದ್ದೇವೆ ಎಂದು ನಾನು ನಿಮಗೆ ಹೇಳುತ್ತೇನೆ.
ಮುಂದೆ ನಾನು ವಾರ್ಮ್ ರೀಸ್ಟಾರ್ಟ್ಗಳೊಂದಿಗೆ ಕೋಸಿಂಗ್ ಅನೆಲಿಂಗ್ ಅಥವಾ ವಾರ್ಮ್ ರೀಸ್ಟಾರ್ಟ್ಗಳೊಂದಿಗೆ ಸ್ಟೊಕಾಸ್ಟಿಕ್ ಗ್ರೇಡಿಯಂಟ್ ಡಿಸೆಂಟ್ ಕುರಿತು ಮಾತನಾಡಲು ಬಯಸುತ್ತೇನೆ. ಸ್ಥೂಲವಾಗಿ ಹೇಳುವುದಾದರೆ, ತಾತ್ವಿಕವಾಗಿ, ನೀವು ಯಾವುದೇ ಆಪ್ಟಿಮೈಜರ್ ಅನ್ನು ಬಳಸಬಹುದು, ಆದರೆ ಪಾಯಿಂಟ್ ಇದು: ನೀವು ಕೇವಲ ಒಂದು ನೆಟ್ವರ್ಕ್ ಅನ್ನು ತರಬೇತಿ ಮಾಡಿದರೆ ಮತ್ತು ಕ್ರಮೇಣ ಅದು ಕನಿಷ್ಠಕ್ಕೆ ಒಮ್ಮುಖವಾಗಿದ್ದರೆ, ಎಲ್ಲವೂ ಸರಿಯಾಗಿದೆ, ನೀವು ಒಂದು ನೆಟ್ವರ್ಕ್ ಪಡೆಯುತ್ತೀರಿ, ಅದು ಕೆಲವು ತಪ್ಪುಗಳನ್ನು ಮಾಡುತ್ತದೆ, ಆದರೆ ನೀವು ಸ್ವಲ್ಪ ವಿಭಿನ್ನವಾಗಿ ತರಬೇತಿ ನೀಡಬಹುದು. ನೀವು ಕೆಲವು ಆರಂಭಿಕ ಕಲಿಕೆಯ ದರವನ್ನು ಹೊಂದಿಸುತ್ತೀರಿ ಮತ್ತು ಈ ಸೂತ್ರದ ಪ್ರಕಾರ ಅದನ್ನು ಕ್ರಮೇಣ ಕಡಿಮೆಗೊಳಿಸುತ್ತೀರಿ. ನೀವು ಅದನ್ನು ಕಡಿಮೆ ಮಾಡಿ, ನಿಮ್ಮ ನೆಟ್ವರ್ಕ್ ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಬರುತ್ತದೆ, ನಂತರ ನೀವು ತೂಕವನ್ನು ಉಳಿಸುತ್ತೀರಿ ಮತ್ತು ತರಬೇತಿಯ ಆರಂಭದಲ್ಲಿದ್ದ ಕಲಿಕೆಯ ದರವನ್ನು ಮತ್ತೆ ಹೊಂದಿಸಿ, ಆ ಮೂಲಕ ಈ ಕನಿಷ್ಠದಿಂದ ಎಲ್ಲೋ ಮೇಲಕ್ಕೆ ಹೋಗಿ ಮತ್ತು ನಿಮ್ಮ ಕಲಿಕೆಯ ದರವನ್ನು ಮತ್ತೆ ಕಡಿಮೆ ಮಾಡಿ.
ಹೀಗಾಗಿ, ನೀವು ಏಕಕಾಲದಲ್ಲಿ ಹಲವಾರು ಕನಿಷ್ಠಗಳನ್ನು ಭೇಟಿ ಮಾಡಬಹುದು, ಇದರಲ್ಲಿ ನಿಮ್ಮ ನಷ್ಟವು ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್ ಆಗಿರುತ್ತದೆ. ಆದರೆ ವಾಸ್ತವವಾಗಿ ಈ ತೂಕವನ್ನು ಹೊಂದಿರುವ ನೆಟ್ವರ್ಕ್ಗಳು ನಿಮ್ಮ ದಿನಾಂಕದಂದು ವಿಭಿನ್ನ ದೋಷಗಳನ್ನು ನೀಡುತ್ತದೆ. ಅವುಗಳನ್ನು ಸರಾಸರಿ ಮಾಡುವ ಮೂಲಕ, ನೀವು ಕೆಲವು ರೀತಿಯ ಅಂದಾಜು ಪಡೆಯುತ್ತೀರಿ ಮತ್ತು ನಿಮ್ಮ ವೇಗವು ಹೆಚ್ಚಾಗಿರುತ್ತದೆ.
ನಾವು ನಮ್ಮ ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ಜೋಡಿಸಿದ್ದೇವೆ ಎಂಬುದರ ಕುರಿತು. ಪ್ರಸ್ತುತಿಯ ಆರಂಭದಲ್ಲಿ, ಪರೀಕ್ಷೆಯಲ್ಲಿನ ಡೇಟಾದ ಪ್ರಮಾಣ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಗೆ ಗಮನ ಕೊಡಲು ನಾನು ಹೇಳಿದೆ. ನೀವು ಪರೀಕ್ಷಾ ಸೆಟ್ನಲ್ಲಿನ ಗುರಿಗಳ ಸಂಖ್ಯೆಗೆ 1 ಅನ್ನು ಸೇರಿಸಿದರೆ ಮತ್ತು ತರಗತಿಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸಿದರೆ, ನೀವು 330 ಸಂಖ್ಯೆಯನ್ನು ಪಡೆಯುತ್ತೀರಿ, ಮತ್ತು ಇದನ್ನು ಫೋರಂನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ - ಪರೀಕ್ಷೆಯಲ್ಲಿ ತರಗತಿಗಳು ಸಮತೋಲಿತವಾಗಿವೆ. ಇದನ್ನು ಬಳಸಬಹುದಿತ್ತು.
ಇದರ ಆಧಾರದ ಮೇಲೆ, ರೋಮನ್ ಸೊಲೊವೀವ್ ಮೆಟ್ರಿಕ್ನೊಂದಿಗೆ ಬಂದರು, ನಾವು ಅದನ್ನು ಪ್ರಾಕ್ಸಿ ಸ್ಕೋರ್ ಎಂದು ಕರೆದಿದ್ದೇವೆ, ಇದು ಲೀಡರ್ಬೋರ್ಡ್ನೊಂದಿಗೆ ಚೆನ್ನಾಗಿ ಸಂಬಂಧ ಹೊಂದಿದೆ. ಮುಖ್ಯ ವಿಷಯವೆಂದರೆ: ನೀವು ಭವಿಷ್ಯವನ್ನು ಮಾಡುತ್ತೀರಿ, ನಿಮ್ಮ ಭವಿಷ್ಯಸೂಚಕಗಳಲ್ಲಿ ಅಗ್ರ 1 ಅನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ ಮತ್ತು ಪ್ರತಿ ವರ್ಗಕ್ಕೆ ವಸ್ತುಗಳ ಸಂಖ್ಯೆಯನ್ನು ಎಣಿಸಿ. ಮುಂದೆ, ಪ್ರತಿ ಮೌಲ್ಯದಿಂದ 330 ಕಳೆಯಿರಿ ಮತ್ತು ಫಲಿತಾಂಶದ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳನ್ನು ಸೇರಿಸಿ.
ಕೆಳಗಿನ ಮೌಲ್ಯಗಳನ್ನು ಪಡೆಯಲಾಗಿದೆ. ಇದು ಪ್ರೋಬಿಂಗ್ ಲೀಡರ್ಬೋರ್ಡ್ ಅನ್ನು ರಚಿಸಲು ನಮಗೆ ಸಹಾಯ ಮಾಡಿತು, ಆದರೆ ಸ್ಥಳೀಯವಾಗಿ ಮೌಲ್ಯೀಕರಿಸಲು ಮತ್ತು ನಮ್ಮ ಮೇಳಗಳಿಗೆ ಗುಣಾಂಕಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡಿತು.
ಒಂದು ಸಮೂಹದೊಂದಿಗೆ ನೀವು ಅಂತಹ ವೇಗವನ್ನು ಪಡೆಯಬಹುದು. ನಾನು ಇನ್ನೇನು ಮಾಡಬಲ್ಲೆ? ನಿಮ್ಮ ಪರೀಕ್ಷೆಯಲ್ಲಿನ ತರಗತಿಗಳು ಸಮತೋಲಿತವಾಗಿವೆ ಎಂಬ ಮಾಹಿತಿಯನ್ನು ನೀವು ಬಳಸಿದ್ದೀರಿ ಎಂದು ಭಾವಿಸೋಣ.
ಸಮತೋಲನವು ವಿಭಿನ್ನವಾಗಿತ್ತು.
ನಾವೇನು ಮಾಡಿದೆವು? ನಮ್ಮ ಸಮತೋಲನವು ತುಂಬಾ ಸರಳವಾಗಿತ್ತು, ಇದನ್ನು ಎವ್ಗೆನಿ ಬಾಬಖ್ನಿನ್ ಸೂಚಿಸಿದ್ದಾರೆ. ನಾವು ಮೊದಲು ನಮ್ಮ ಮುನ್ನೋಟಗಳನ್ನು ಟಾಪ್ 1 ಮತ್ತು ಅವರಲ್ಲಿ ಅಭ್ಯರ್ಥಿಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಿದ್ದೇವೆ - ಆದ್ದರಿಂದ ತರಗತಿಗಳ ಸಂಖ್ಯೆ 330 ಕ್ಕಿಂತ ಹೆಚ್ಚಿಲ್ಲ. ಆದರೆ ಕೆಲವು ತರಗತಿಗಳಿಗೆ ನೀವು 330 ಕ್ಕಿಂತ ಕಡಿಮೆ ಮುನ್ಸೂಚಕರನ್ನು ಹೊಂದಿರುತ್ತೀರಿ. ಸರಿ, ನಾವು ಟಾಪ್ 2 ಮತ್ತು ಟಾಪ್ 3 ರ ಪ್ರಕಾರವೂ ವಿಂಗಡಿಸೋಣ , ಮತ್ತು ನಾವು ಅಭ್ಯರ್ಥಿಗಳನ್ನು ಸಹ ಆಯ್ಕೆ ಮಾಡುತ್ತೇವೆ.
ನಮ್ಮ ಸಮತೋಲನವು ಮೊದಲ ಸ್ಥಾನದ ಸಮತೋಲನದಿಂದ ಹೇಗೆ ಭಿನ್ನವಾಗಿದೆ? ಅವರು ಪುನರಾವರ್ತನೆಯ ವಿಧಾನವನ್ನು ಬಳಸಿದರು, ಹೆಚ್ಚು ಜನಪ್ರಿಯ ವರ್ಗವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ ಮತ್ತು ಆ ವರ್ಗವು ಹೆಚ್ಚು ಜನಪ್ರಿಯವಾಗದವರೆಗೆ ಆ ವರ್ಗದ ಸಂಭವನೀಯತೆಯನ್ನು ಕೆಲವು ಸಣ್ಣ ಸಂಖ್ಯೆಗಳಿಂದ ಕಡಿಮೆ ಮಾಡಿದರು. ನಾವು ಮುಂದಿನ ಅತ್ಯಂತ ಜನಪ್ರಿಯ ತರಗತಿಯನ್ನು ತೆಗೆದುಕೊಂಡಿದ್ದೇವೆ. ಆದ್ದರಿಂದ ಅವರು ಎಲ್ಲಾ ವರ್ಗಗಳ ಸಂಖ್ಯೆಯು ಸಮಾನವಾಗುವವರೆಗೆ ಅವುಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುವುದನ್ನು ಮುಂದುವರೆಸಿದರು.
ಪ್ರತಿಯೊಬ್ಬರೂ ರೈಲು ನೆಟ್ವರ್ಕ್ಗಳಿಗೆ ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್ ಒನ್ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತಾರೆ, ಆದರೆ ಎಲ್ಲರೂ ಸಮತೋಲನವನ್ನು ಬಳಸಲಿಲ್ಲ. ಸಮತೋಲನವನ್ನು ಬಳಸಿಕೊಂಡು, ನೀವು ಚಿನ್ನಕ್ಕೆ ಹೋಗಬಹುದು, ಮತ್ತು ನೀವು ಅದೃಷ್ಟವಂತರಾಗಿದ್ದರೆ, ನಂತರ ಹಣಕ್ಕೆ ಹೋಗಬಹುದು.
ದಿನಾಂಕವನ್ನು ಪೂರ್ವಭಾವಿಯಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವುದು ಹೇಗೆ? ಪ್ರತಿಯೊಬ್ಬರೂ ದಿನಾಂಕವನ್ನು ಪೂರ್ವ-ಸಂಸ್ಕರಿಸಿದ್ದಾರೆ, ಪ್ಲಸ್ ಅಥವಾ ಮೈನಸ್, ಅದೇ ರೀತಿಯಲ್ಲಿ - ಕರಕುಶಲ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ತಯಾರಿಸುವುದು, ವಿಭಿನ್ನ ಸ್ಟ್ರೋಕ್ ಬಣ್ಣಗಳೊಂದಿಗೆ ಸಮಯವನ್ನು ಎನ್ಕೋಡ್ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುವುದು ಇತ್ಯಾದಿ. 8 ನೇ ಸ್ಥಾನವನ್ನು ಪಡೆದ ಅಲೆಕ್ಸಿ ನೊಜ್ಡ್ರಿನ್-ಪ್ಲೋಟ್ನಿಟ್ಸ್ಕಿ ಅವರು ಮಾತನಾಡಿದರು.
ಅವನು ಅದನ್ನು ವಿಭಿನ್ನವಾಗಿ ಮಾಡಿದನು. ನಿಮ್ಮ ಈ ಎಲ್ಲಾ ಕರಕುಶಲ ವೈಶಿಷ್ಟ್ಯಗಳು ಕೆಲಸ ಮಾಡುವುದಿಲ್ಲ, ನೀವು ಅದನ್ನು ಮಾಡಬೇಕಾಗಿಲ್ಲ, ನಿಮ್ಮ ನೆಟ್ವರ್ಕ್ ಇದೆಲ್ಲವನ್ನೂ ಸ್ವತಃ ಕಲಿಯಬೇಕು ಎಂದು ಹೇಳಿದರು. ಮತ್ತು ಬದಲಾಗಿ, ಅವರು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪೂರ್ವಭಾವಿಯಾಗಿ ಸಂಸ್ಕರಿಸಿದ ಕಲಿಕೆಯ ಮಾಡ್ಯೂಲ್ಗಳೊಂದಿಗೆ ಬಂದರು. ಅವರು ಪೂರ್ವ ಸಂಸ್ಕರಣೆ ಮಾಡದೆ ಮೂಲ ಡೇಟಾವನ್ನು ಎಸೆದರು - ಪಾಯಿಂಟ್ ಕಕ್ಷೆಗಳು ಮತ್ತು ಸಮಯಗಳು.
ನಂತರ ಅವರು ನಿರ್ದೇಶಾಂಕಗಳ ಆಧಾರದ ಮೇಲೆ ವ್ಯತ್ಯಾಸವನ್ನು ತೆಗೆದುಕೊಂಡರು ಮತ್ತು ಸಮಯದ ಆಧಾರದ ಮೇಲೆ ಎಲ್ಲವನ್ನೂ ಸರಾಸರಿ ಮಾಡಿದರು. ಮತ್ತು ಅವರು ದೀರ್ಘವಾದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನೊಂದಿಗೆ ಬಂದರು. 1xn ಗಾತ್ರದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ಪಡೆಯಲು ಅವರು 64D ಕನ್ವಲ್ಯೂಷನ್ ಅನ್ನು ಹಲವಾರು ಬಾರಿ ಅನ್ವಯಿಸಿದರು, ಅಲ್ಲಿ n ಒಟ್ಟು ಅಂಕಗಳ ಸಂಖ್ಯೆ, ಮತ್ತು 64 ಅನ್ನು ಯಾವುದೇ ಕನ್ವಲ್ಯೂಷನಲ್ ನೆಟ್ವರ್ಕ್ನ ಪದರಕ್ಕೆ ಫೀಡ್ ಮಾಡಲು 64 ಅನ್ನು ತಯಾರಿಸಲಾಗುತ್ತದೆ, ಇದು ಚಾನಲ್ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಸ್ವೀಕರಿಸುತ್ತದೆ. - 64. ಅವರು 64xn ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಅನ್ನು ಪಡೆದರು, ನಂತರ ಇದರಿಂದ ಕೆಲವು ಗಾತ್ರದ ಟೆನ್ಸರ್ ಅನ್ನು ರಚಿಸುವುದು ಅಗತ್ಯವಾಗಿತ್ತು ಇದರಿಂದ ಚಾನಲ್ಗಳ ಸಂಖ್ಯೆ 0 ಕ್ಕೆ ಸಮನಾಗಿರುತ್ತದೆ. ಅವರು 32 ರಿಂದ 32 ರವರೆಗಿನ ವ್ಯಾಪ್ತಿಯಲ್ಲಿ X, Y ಎಲ್ಲಾ ಬಿಂದುಗಳನ್ನು ಸಾಮಾನ್ಯೀಕರಿಸಿದರು. 32x32 ಗಾತ್ರದ ಟೆನ್ಸರ್. ಅವರು 32x64 ಅನ್ನು ಏಕೆ ಬಯಸಿದ್ದರು ಎಂದು ನನಗೆ ತಿಳಿದಿಲ್ಲ, ಅದು ಆ ರೀತಿಯಲ್ಲಿ ಸಂಭವಿಸಿದೆ. ಮತ್ತು ಈ ನಿರ್ದೇಶಾಂಕದಲ್ಲಿ ಅವರು 32xn ಗಾತ್ರದ ಈ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನ ತುಣುಕನ್ನು ಇರಿಸಿದರು. ಆದ್ದರಿಂದ ಇದು ಕೇವಲ 32x64xXNUMX ಟೆನ್ಸರ್ನೊಂದಿಗೆ ಕೊನೆಗೊಂಡಿತು ಮತ್ತು ನಿಮ್ಮ ಕನ್ವಲ್ಯೂಷನಲ್ ನ್ಯೂರಲ್ ನೆಟ್ವರ್ಕ್ಗೆ ನೀವು ಮತ್ತಷ್ಟು ಸೇರಿಸಬಹುದು. ನಾನು ಹೇಳಲು ಬಯಸಿದ್ದು ಇಷ್ಟೇ.
ಮೂಲ: www.habr.com