ಮೈಕ್ರೋಸಾಫ್ಟ್ ಮತ್ತು ಸೆಂಟ್ರಲ್ ಚೀನಾ ವಿಶ್ವವಿದ್ಯಾಲಯದ ಸಂಶೋಧಕರು ಯಂತ್ರ ಕಲಿಕೆ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ಬಳಸಿಕೊಂಡು ವೀಡಿಯೊದಲ್ಲಿ ಬಹು ವಸ್ತುಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು ಹೊಸ ಉನ್ನತ-ಕಾರ್ಯಕ್ಷಮತೆಯ ವಿಧಾನ - ಫೇರ್ಮೋಟ್ (ಫೇರ್ ಮಲ್ಟಿ-ಆಬ್ಜೆಕ್ಟ್ ಟ್ರ್ಯಾಕಿಂಗ್). ಪೈಟೋರ್ಚ್ನಲ್ಲಿ ವಿಧಾನವನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುವ ಕೋಡ್ ಮತ್ತು ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು. GitHub ನಲ್ಲಿ.
ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಹೆಚ್ಚಿನ ವಸ್ತು ಟ್ರ್ಯಾಕಿಂಗ್ ವಿಧಾನಗಳು ಎರಡು ಹಂತಗಳನ್ನು ಬಳಸುತ್ತವೆ, ಪ್ರತಿಯೊಂದನ್ನು ಪ್ರತ್ಯೇಕ ನರಮಂಡಲದಿಂದ ಕಾರ್ಯಗತಗೊಳಿಸಲಾಗುತ್ತದೆ. ಮೊದಲ ಹಂತವು ಆಸಕ್ತಿಯ ವಸ್ತುಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಒಂದು ಮಾದರಿಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುತ್ತದೆ, ಆದರೆ ಎರಡನೇ ಹಂತವು ವಸ್ತುಗಳನ್ನು ಮರು-ಗುರುತಿಸಲು ಮತ್ತು ಅವುಗಳಿಗೆ ಆಂಕರ್ಗಳನ್ನು ನಿಯೋಜಿಸಲು ಅಸೋಸಿಯೇಷನ್ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ.
ಫೇರ್ಮೋಟ್ ವಿರೂಪಗೊಳ್ಳಬಹುದಾದ ಕನ್ವಲ್ಯೂಷನಲ್ ನರಮಂಡಲದ ಆಧಾರದ ಮೇಲೆ ಏಕ-ಹಂತದ ಅನುಷ್ಠಾನವನ್ನು ಬಳಸುತ್ತದೆ (ಫೇರ್ಮೋಟ್ (ಡಿಫಾರ್ಮೇಬಲ್ ಕನ್ವಲ್ಯೂಷನಲ್ ನೆಟ್ವರ್ಕ್), ಇದು ಆಬ್ಜೆಕ್ಟ್ ಟ್ರ್ಯಾಕಿಂಗ್ ವೇಗವನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸುತ್ತದೆ. ಫೇರ್ಮೋಟ್ ಆಂಕರ್ಗಳಿಲ್ಲದೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಹೆಚ್ಚಿನ ನಿಖರತೆಯ ಆಬ್ಜೆಕ್ಟ್ ಮ್ಯಾಪ್ನಲ್ಲಿ ಆಬ್ಜೆಕ್ಟ್ ಸೆಂಟರ್ ಆಫ್ಸೆಟ್ಗಳನ್ನು ನಿರ್ಧರಿಸಲು ಮರುಗುರುತಿಸುವಿಕೆ ಕಾರ್ಯವಿಧಾನವನ್ನು ಬಳಸುತ್ತದೆ. ಒಂದು ಸಮಾನಾಂತರ ಪ್ರೊಸೆಸರ್ ಅವುಗಳ ಗುರುತನ್ನು ಊಹಿಸಲು ಬಳಸಬಹುದಾದ ಪ್ರತ್ಯೇಕ ಆಬ್ಜೆಕ್ಟ್ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮುಖ್ಯ ಮಾಡ್ಯೂಲ್ ಈ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸಂಯೋಜಿಸಿ ವಿಭಿನ್ನ ಮಾಪಕಗಳ ವಸ್ತುಗಳನ್ನು ಕುಶಲತೆಯಿಂದ ನಿರ್ವಹಿಸುತ್ತದೆ.

FairMOT ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, ಜನರ ಪತ್ತೆ ಮತ್ತು ಹುಡುಕಾಟಕ್ಕಾಗಿ ಆರು ಸಾರ್ವಜನಿಕ ಡೇಟಾಸೆಟ್ಗಳ ಸಂಯೋಜನೆಯನ್ನು (ETH, CityPerson, CalTech, MOT17, CUHK-SYSU) ಬಳಸಲಾಯಿತು. ಈ ಮಾದರಿಯನ್ನು ಮೌಲ್ಯೀಕರಣ ವೀಡಿಯೊ ಸೆಟ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಪರೀಕ್ಷಿಸಲಾಯಿತು. , , и ಯೋಜನೆಯಿಂದ ಒದಗಿಸಲಾಗಿದೆ ಮತ್ತು ವಿವಿಧ ಸನ್ನಿವೇಶಗಳು, ಕ್ಯಾಮೆರಾ ಚಲನೆ ಅಥವಾ ತಿರುಗುವಿಕೆ ಮತ್ತು ವಿವಿಧ ವೀಕ್ಷಣಾ ಕೋನಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಪರೀಕ್ಷೆಯು ಅದನ್ನು ತೋರಿಸಿದೆ
ಫೇರ್ಮೋಟ್ ವೇಗದ ಸ್ಪರ್ಧಾತ್ಮಕ ಮಾದರಿಗಳು и ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 30 ಫ್ರೇಮ್ಗಳಲ್ಲಿ ವೀಡಿಯೊ ಸ್ಟ್ರೀಮ್ಗಳಲ್ಲಿ ಪರೀಕ್ಷಿಸಿದಾಗ, ನಿಯಮಿತ ವೀಡಿಯೊ ಸ್ಟ್ರೀಮ್ಗಳನ್ನು ತ್ವರಿತವಾಗಿ ವಿಶ್ಲೇಷಿಸಲು ಸಾಕಷ್ಟು ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ.
ಮೂಲ: opennet.ru
