ಮಾನವನ ದೃಷ್ಟಿ ಕಾರ್ಟೆಕ್ಸ್ನಲ್ಲಿನ ಜೈವಿಕ ಪ್ರಕ್ರಿಯೆಗಳಿಂದ ಪ್ರೇರಿತವಾದ ಕನ್ವಲ್ಯೂಷನಲ್ ನ್ಯೂರಲ್ ನೆಟ್ವರ್ಕ್ಗಳು (CNNs), ವಸ್ತು ಮತ್ತು ಮುಖ ಗುರುತಿಸುವಿಕೆಯಂತಹ ಕಾರ್ಯಗಳಿಗೆ ಸೂಕ್ತವಾಗಿವೆ, ಆದರೆ ಅವುಗಳ ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸಲು ಬೇಸರದ ಮತ್ತು ಉತ್ತಮ-ಶ್ರುತಿ ಅಗತ್ಯವಿದೆ. ಅದಕ್ಕಾಗಿಯೇ ಗೂಗಲ್ ಎಐ ರಿಸರ್ಚ್ನ ವಿಜ್ಞಾನಿಗಳು ಸಿಎನ್ಎನ್ಗಳನ್ನು "ಹೆಚ್ಚು ರಚನಾತ್ಮಕ" ರೀತಿಯಲ್ಲಿ ಅಳೆಯುವ ಹೊಸ ಮಾದರಿಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತಿದ್ದಾರೆ. ಅವರು ತಮ್ಮ ಕೆಲಸದ ಫಲಿತಾಂಶಗಳನ್ನು ಪ್ರಕಟಿಸಿದರು
"ಸ್ಕೇಲಿಂಗ್ ಮಾಡೆಲ್ಗಳ ಸಾಮಾನ್ಯ ಅಭ್ಯಾಸವೆಂದರೆ ಸಿಎನ್ಎನ್ನ ಆಳ ಅಥವಾ ಅಗಲವನ್ನು ನಿರಂಕುಶವಾಗಿ ಹೆಚ್ಚಿಸುವುದು ಮತ್ತು ತರಬೇತಿ ಮತ್ತು ಮೌಲ್ಯಮಾಪನಕ್ಕಾಗಿ ಇನ್ಪುಟ್ ಇಮೇಜ್ನ ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಬಳಸುವುದು" ಎಂದು ಸಿಬ್ಬಂದಿ ಸಾಫ್ಟ್ವೇರ್ ಎಂಜಿನಿಯರ್ ಮಿಂಗ್ಕ್ಸಿಂಗ್ ಟ್ಯಾನ್ ಮತ್ತು ಗೂಗಲ್ ಎಐ ಪ್ರಮುಖ ವಿಜ್ಞಾನಿ ಕ್ವೋಕ್ ವಿ . ಲೆ) ಬರೆಯುತ್ತಾರೆ. "ಅಗಲ, ಆಳ ಮತ್ತು ಇನ್ಪುಟ್ ರೆಸಲ್ಯೂಶನ್ನಂತಹ ನೆಟ್ವರ್ಕ್ ನಿಯತಾಂಕಗಳನ್ನು ನಿರಂಕುಶವಾಗಿ ಅಳೆಯುವ ಸಾಂಪ್ರದಾಯಿಕ ವಿಧಾನಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ನಮ್ಮ ವಿಧಾನವು ಪ್ರತಿ ಆಯಾಮವನ್ನು ಸ್ಥಿರವಾದ ಸ್ಕೇಲಿಂಗ್ ಅಂಶಗಳೊಂದಿಗೆ ಏಕರೂಪವಾಗಿ ಅಳೆಯುತ್ತದೆ."
ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಇನ್ನಷ್ಟು ಸುಧಾರಿಸಲು, ಸಂಶೋಧಕರು ಹೊಸ ಬೆನ್ನೆಲುಬು ನೆಟ್ವರ್ಕ್ ಅನ್ನು ಬಳಸುತ್ತಾರೆ, ಮೊಬೈಲ್ ಇನ್ವರ್ಟೆಡ್ ಬಾಟಲ್ನೆಕ್ ಕನ್ವಲ್ಯೂಷನ್ (MBConv), ಇದು ಎಫಿಶಿಯೆಂಟ್ನೆಟ್ಸ್ ಕುಟುಂಬದ ಮಾದರಿಗಳಿಗೆ ಆಧಾರವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.
ಪರೀಕ್ಷೆಗಳಲ್ಲಿ, ಎಫಿಶಿಯೆಂಟ್ನೆಟ್ಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸಿಎನ್ಎನ್ಗಳಿಗಿಂತ ಹೆಚ್ಚಿನ ನಿಖರತೆ ಮತ್ತು ಉತ್ತಮ ದಕ್ಷತೆಯನ್ನು ಪ್ರದರ್ಶಿಸಿವೆ, ಪ್ಯಾರಾಮೀಟರ್ ಗಾತ್ರ ಮತ್ತು ಕಂಪ್ಯೂಟೇಶನಲ್ ಸಂಪನ್ಮೂಲ ಅವಶ್ಯಕತೆಗಳನ್ನು ಪರಿಮಾಣದ ಕ್ರಮದಿಂದ ಕಡಿಮೆ ಮಾಡುತ್ತದೆ. ಮಾದರಿಗಳಲ್ಲಿ ಒಂದಾದ EfficientNet-B7, ಪ್ರಸಿದ್ಧ CNN Gpipe ಗಿಂತ 8,4 ಪಟ್ಟು ಚಿಕ್ಕ ಗಾತ್ರ ಮತ್ತು 6,1 ಪಟ್ಟು ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪ್ರದರ್ಶಿಸಿತು ಮತ್ತು ಪರೀಕ್ಷೆಯಲ್ಲಿ 84,4% ಮತ್ತು 97,1% ನಿಖರತೆಯನ್ನು (ಟಾಪ್-1 ಮತ್ತು ಟಾಪ್-5) ಸಾಧಿಸಿದೆ. ಇಮೇಜ್ ನೆಟ್ ಸೆಟ್. ಜನಪ್ರಿಯ CNN ResNet-50 ಗೆ ಹೋಲಿಸಿದರೆ, ಮತ್ತೊಂದು EfficientNet ಮಾದರಿ, EfficientNet-B4, ಇದೇ ರೀತಿಯ ಸಂಪನ್ಮೂಲಗಳನ್ನು ಬಳಸಿಕೊಂಡು, ResNet-82,6 ಗಾಗಿ 76,3% ವಿರುದ್ಧ 50% ನಿಖರತೆಯನ್ನು ಸಾಧಿಸಿದೆ.
ಎಫಿಶಿಯೆಂಟ್ನೆಟ್ಸ್ ಮಾದರಿಗಳು ಇತರ ಡೇಟಾಸೆಟ್ಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ, CIFAR-100 ಡೇಟಾಸೆಟ್ (91,7% ನಿಖರತೆ) ಸೇರಿದಂತೆ ಎಂಟು ಮಾನದಂಡಗಳಲ್ಲಿ ಐದು ಹೆಚ್ಚಿನ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸುತ್ತವೆ.
"ನರ ಮಾದರಿಗಳ ದಕ್ಷತೆಯಲ್ಲಿ ಗಮನಾರ್ಹ ಸುಧಾರಣೆಗಳನ್ನು ಒದಗಿಸುವ ಮೂಲಕ, ಭವಿಷ್ಯದ ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಕಾರ್ಯಗಳಿಗಾಗಿ ಎಫಿಶಿಯೆಂಟ್ನೆಟ್ಗಳು ಹೊಸ ಚೌಕಟ್ಟಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ ಎಂದು ನಾವು ನಿರೀಕ್ಷಿಸುತ್ತೇವೆ" ಎಂದು ಟಾನ್ ಮತ್ತು ಲಿ ಬರೆಯುತ್ತಾರೆ.
ಗೂಗಲ್ನ ಕ್ಲೌಡ್ ಟೆನ್ಸರ್ ಪ್ರೊಸೆಸಿಂಗ್ ಯೂನಿಟ್ಗಳಿಗೆ (ಟಿಪಿಯು) ಮೂಲ ಕೋಡ್ ಮತ್ತು ತರಬೇತಿ ಸ್ಕ್ರಿಪ್ಟ್ಗಳು ಇಲ್ಲಿ ಉಚಿತವಾಗಿ ಲಭ್ಯವಿದೆ
ಮೂಲ: 3dnews.ru