ಧ್ವನಿಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸಲು Google ಡೇಟಾ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತದೆ

ಗೂಗಲ್ ಪ್ರಕಟಿಸಲಾಗಿದೆ ಅನಿಯಂತ್ರಿತ ಮಿಶ್ರ ಶಬ್ದಗಳನ್ನು ಅವುಗಳ ಪ್ರತ್ಯೇಕ ಘಟಕಗಳಾಗಿ ಪ್ರತ್ಯೇಕಿಸಲು ಬಳಸುವ ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಬಳಸಬಹುದಾದ ಉಲ್ಲೇಖ ಮಿಶ್ರ ಶಬ್ದಗಳ ಟಿಪ್ಪಣಿ ಡೇಟಾಬೇಸ್. ಧ್ವನಿಗಳನ್ನು ಪ್ರತ್ಯೇಕಿಸಲು Tensorflow ನಲ್ಲಿ ಬಳಸಬಹುದಾದ ಸಾಮಾನ್ಯ ಆಳವಾದ ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿ (TDCN++) ಅನ್ನು ಸಹ ಪ್ರಕಟಿಸಲಾಗಿದೆ. ಸಂಗ್ರಹಣೆಯ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾವನ್ನು ಸಿದ್ಧಪಡಿಸಲಾಗಿದೆ freesound.org и ಪ್ರಕಟಿಸಲಾಗಿದೆ CC BY 4.0 ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ.

ಪ್ರಸ್ತುತಪಡಿಸಿದ ಯೋಜನೆ FUSS (ಉಚಿತ ಯೂನಿವರ್ಸಲ್ ಸೌಂಡ್ ಸೆಪರೇಶನ್) ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಅನಿಯಂತ್ರಿತ ಶಬ್ದಗಳನ್ನು ಬೇರ್ಪಡಿಸುವ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ, ಅದರ ಸ್ವರೂಪವು ಮುಂಚಿತವಾಗಿ ತಿಳಿದಿಲ್ಲ. ಇತರ ರೀತಿಯ ವ್ಯವಸ್ಥೆಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಕೆಲವು ಶಬ್ದಗಳ ನಡುವೆ ವ್ಯತ್ಯಾಸವನ್ನು ಗುರುತಿಸುವ ಕಾರ್ಯಕ್ಕೆ ಸೀಮಿತವಾಗಿವೆ, ಉದಾಹರಣೆಗೆ ಧ್ವನಿಗಳು ಮತ್ತು ಧ್ವನಿಗಳು ಅಥವಾ ವಿಭಿನ್ನ ಜನರು ಮಾತನಾಡುತ್ತಾರೆ.

ಡೇಟಾಬೇಸ್ ಸುಮಾರು 20 ಸಾವಿರ ಮಿಶ್ರಣಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಗೋಡೆಯ ಪ್ರತಿಬಿಂಬ, ಧ್ವನಿ ಮೂಲ ಸ್ಥಳ ಮತ್ತು ಮೈಕ್ರೊಫೋನ್ ಸ್ಥಳವನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುವ ಕಸ್ಟಮ್-ನಿರ್ಮಿತ ಕೊಠಡಿ ಸಿಮ್ಯುಲೇಟರ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪೂರ್ವ-ಲೆಕ್ಕಾಚಾರದ ಕೋಣೆಯ ಉದ್ವೇಗ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಕಿಟ್ ಒಳಗೊಂಡಿದೆ.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ