ಯಂತ್ರ ಕಲಿಕೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಫೇಸ್‌ಬುಕ್ ಎನ್‌ಕೋಡೆಕ್ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಪ್ರಕಟಿಸುತ್ತದೆ

ಮೆಟಾ/ಫೇಸ್‌ಬುಕ್ (ರಷ್ಯನ್ ಒಕ್ಕೂಟದಲ್ಲಿ ನಿಷೇಧಿಸಲಾಗಿದೆ) ಎನ್‌ಕೋಡೆಕ್ ಎಂಬ ಹೊಸ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಪರಿಚಯಿಸಿತು, ಇದು ಗುಣಮಟ್ಟವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ ಸಂಕೋಚನ ಅನುಪಾತವನ್ನು ಹೆಚ್ಚಿಸಲು ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಕೋಡೆಕ್ ಅನ್ನು ನೈಜ ಸಮಯದಲ್ಲಿ ಆಡಿಯೊವನ್ನು ಸ್ಟ್ರೀಮಿಂಗ್ ಮಾಡಲು ಮತ್ತು ನಂತರ ಫೈಲ್‌ಗಳಲ್ಲಿ ಉಳಿಸಲು ಎನ್‌ಕೋಡಿಂಗ್ ಮಾಡಲು ಬಳಸಬಹುದು. ಎನ್‌ಕೋಡೆಕ್ ಉಲ್ಲೇಖದ ಅನುಷ್ಠಾನವನ್ನು ಪೈಟಾರ್ಚ್ ಫ್ರೇಮ್‌ವರ್ಕ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು ವಾಣಿಜ್ಯೇತರ ಬಳಕೆಗಾಗಿ ಮಾತ್ರ CC BY-NC 4.0 (ಕ್ರಿಯೇಟಿವ್ ಕಾಮನ್ಸ್ ಅಟ್ರಿಬ್ಯೂಷನ್-ವಾಣಿಜ್ಯೇತರ) ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ.

ಡೌನ್‌ಲೋಡ್ ಮಾಡಲು ಎರಡು ಸಿದ್ಧ ಮಾದರಿಗಳನ್ನು ನೀಡಲಾಗುತ್ತದೆ:

  • 24 kHz ಮಾದರಿ ದರವನ್ನು ಬಳಸಿಕೊಂಡು ಒಂದು ಸಾಂದರ್ಭಿಕ ಮಾದರಿ, ಮೊನೊಫೊನಿಕ್ ಆಡಿಯೊವನ್ನು ಮಾತ್ರ ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು ವೈವಿಧ್ಯಮಯ ಆಡಿಯೊ ಡೇಟಾದಲ್ಲಿ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ (ಸ್ಪೀಚ್ ಕೋಡಿಂಗ್‌ಗೆ ಸೂಕ್ತವಾಗಿದೆ). 1.5, 3, 6, 12 ಮತ್ತು 24 kbps ಬಿಟ್ ದರಗಳಲ್ಲಿ ಪ್ರಸಾರಕ್ಕಾಗಿ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಪ್ಯಾಕೇಜ್ ಮಾಡಲು ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದು.
  • 48 kHz ನ ಮಾದರಿ ದರವನ್ನು ಬಳಸುವ ಕಾರಣವಲ್ಲದ ಮಾದರಿ, ಸ್ಟಿರಿಯೊ ಆಡಿಯೊವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು ಸಂಗೀತದಲ್ಲಿ ಮಾತ್ರ ತರಬೇತಿ ನೀಡಲಾಗುತ್ತದೆ. ಮಾದರಿಯು 3, 6, 12 ಮತ್ತು 24 kbps ನ ಬಿಟ್ರೇಟ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ.

ಪ್ರತಿ ಮಾದರಿಗೆ, ಹೆಚ್ಚುವರಿ ಭಾಷಾ ಮಾದರಿಯನ್ನು ಸಿದ್ಧಪಡಿಸಲಾಗಿದೆ, ಇದು ಗುಣಮಟ್ಟವನ್ನು ಕಳೆದುಕೊಳ್ಳದೆ ಸಂಕೋಚನ ಅನುಪಾತದಲ್ಲಿ (40% ವರೆಗೆ) ಗಮನಾರ್ಹ ಹೆಚ್ಚಳವನ್ನು ಸಾಧಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಆಡಿಯೊ ಕಂಪ್ರೆಷನ್‌ಗಾಗಿ ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹಿಂದೆ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ಯೋಜನೆಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ಎನ್‌ಕೋಡೆಕ್ ಅನ್ನು ಭಾಷಣ ಪ್ಯಾಕೇಜಿಂಗ್‌ಗೆ ಮಾತ್ರವಲ್ಲದೆ, ಆಡಿಯೊ ಸಿಡಿಗಳ ಮಟ್ಟಕ್ಕೆ ಅನುಗುಣವಾಗಿ 48 kHz ಮಾದರಿ ದರದೊಂದಿಗೆ ಸಂಗೀತ ಸಂಕೋಚನಕ್ಕಾಗಿಯೂ ಬಳಸಬಹುದು. ಹೊಸ ಕೊಡೆಕ್‌ನ ಅಭಿವರ್ಧಕರ ಪ್ರಕಾರ, MP64 ಫಾರ್ಮ್ಯಾಟ್‌ಗೆ ಹೋಲಿಸಿದರೆ 3 kbps ಬಿಟ್‌ರೇಟ್‌ನೊಂದಿಗೆ ಪ್ರಸಾರ ಮಾಡುವಾಗ, ಅದೇ ಮಟ್ಟದ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳುವಾಗ ಅವರು ಆಡಿಯೊ ಸಂಕೋಚನದ ಮಟ್ಟವನ್ನು ಸರಿಸುಮಾರು ಹತ್ತು ಪಟ್ಟು ಹೆಚ್ಚಿಸಲು ಸಾಧ್ಯವಾಯಿತು (ಉದಾಹರಣೆಗೆ, ಬಳಸುವಾಗ MP3, 64 kbps ಬ್ಯಾಂಡ್‌ವಿಡ್ತ್ ಅಗತ್ಯವಿದೆ, ಅದರೊಂದಿಗೆ ಪ್ರಸಾರ ಮಾಡಲು ಎನ್‌ಕೋಡೆಕ್‌ನಲ್ಲಿ ಅದೇ ಗುಣಮಟ್ಟವು 6 kbps ಸಾಕು).

ಕೋಡೆಕ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಅನ್ನು "ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್" ಆರ್ಕಿಟೆಕ್ಚರ್‌ನೊಂದಿಗೆ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್‌ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾಗಿದೆ ಮತ್ತು ಇದು ನಾಲ್ಕು ಲಿಂಕ್‌ಗಳನ್ನು ಆಧರಿಸಿದೆ: ಎನ್‌ಕೋಡರ್, ಕ್ವಾಂಟೈಸರ್, ಡಿಕೋಡರ್ ಮತ್ತು ಡಿಸ್ಕ್ರಿಮಿನೇಟರ್. ಎನ್‌ಕೋಡರ್ ಧ್ವನಿ ಡೇಟಾದ ನಿಯತಾಂಕಗಳನ್ನು ಹೊರತೆಗೆಯುತ್ತದೆ ಮತ್ತು ಪ್ಯಾಕ್ ಮಾಡಿದ ಸ್ಟ್ರೀಮ್ ಅನ್ನು ಕಡಿಮೆ ಫ್ರೇಮ್ ದರಕ್ಕೆ ಪರಿವರ್ತಿಸುತ್ತದೆ. ಕ್ವಾಂಟೈಸರ್ (RVQ, ರೆಸಿಡ್ಯೂಯಲ್ ವೆಕ್ಟರ್ ಕ್ವಾಂಟೈಸರ್) ಎನ್‌ಕೋಡರ್ ಮೂಲಕ ಸ್ಟ್ರೀಮ್ ಔಟ್‌ಪುಟ್ ಅನ್ನು ಪ್ಯಾಕೆಟ್‌ಗಳ ಸೆಟ್‌ಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ, ಆಯ್ಕೆಮಾಡಿದ ಬಿಟ್ರೇಟ್ ಆಧರಿಸಿ ಮಾಹಿತಿಯನ್ನು ಸಂಕುಚಿತಗೊಳಿಸುತ್ತದೆ. ಕ್ವಾಂಟೈಜರ್‌ನ ಔಟ್‌ಪುಟ್ ಡೇಟಾದ ಸಂಕುಚಿತ ಪ್ರಾತಿನಿಧ್ಯವಾಗಿದೆ, ಇದು ನೆಟ್‌ವರ್ಕ್ ಮೂಲಕ ಪ್ರಸಾರ ಮಾಡಲು ಅಥವಾ ಡಿಸ್ಕ್‌ಗೆ ಉಳಿಸಲು ಸೂಕ್ತವಾಗಿದೆ.

ಡಿಕೋಡರ್ ಡೇಟಾದ ಸಂಕುಚಿತ ಪ್ರಾತಿನಿಧ್ಯವನ್ನು ಡಿಕೋಡ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮೂಲ ಧ್ವನಿ ತರಂಗವನ್ನು ಪುನರ್ನಿರ್ಮಿಸುತ್ತದೆ. ತಾರತಮ್ಯವು ಮಾನವ ಶ್ರವಣೇಂದ್ರಿಯ ಗ್ರಹಿಕೆಯ ಮಾದರಿಯನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಂಡು ರಚಿತವಾದ ಮಾದರಿಗಳ ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸುತ್ತದೆ. ಗುಣಮಟ್ಟ ಮತ್ತು ಬಿಟ್ರೇಟ್‌ನ ಮಟ್ಟವನ್ನು ಲೆಕ್ಕಿಸದೆಯೇ, ಎನ್‌ಕೋಡಿಂಗ್ ಮತ್ತು ಡಿಕೋಡಿಂಗ್‌ಗೆ ಬಳಸಲಾಗುವ ಮಾದರಿಗಳನ್ನು ಸಾಕಷ್ಟು ಸಾಧಾರಣ ಸಂಪನ್ಮೂಲ ಅವಶ್ಯಕತೆಗಳಿಂದ ಪ್ರತ್ಯೇಕಿಸಲಾಗಿದೆ (ನೈಜ-ಸಮಯದ ಕಾರ್ಯಾಚರಣೆಗೆ ಅಗತ್ಯವಾದ ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಒಂದೇ CPU ಕೋರ್‌ನಲ್ಲಿ ನಡೆಸಲಾಗುತ್ತದೆ).

ಯಂತ್ರ ಕಲಿಕೆಯನ್ನು ಬಳಸಿಕೊಂಡು ಫೇಸ್‌ಬುಕ್ ಎನ್‌ಕೋಡೆಕ್ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಪ್ರಕಟಿಸುತ್ತದೆ


ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ