ಗೂಗಲ್ ಲೈರಾ ವಿ2 ಓಪನ್ ಸೋರ್ಸ್ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತದೆ

Google Lyra V2 ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಪರಿಚಯಿಸಿದೆ, ಇದು ಅತ್ಯಂತ ನಿಧಾನವಾದ ಸಂವಹನ ಚಾನಲ್‌ಗಳಲ್ಲಿ ಗರಿಷ್ಠ ಧ್ವನಿ ಗುಣಮಟ್ಟವನ್ನು ಸಾಧಿಸಲು ಯಂತ್ರ ಕಲಿಕೆ ತಂತ್ರಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಹೊಸ ಆವೃತ್ತಿಯು ಹೊಸ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗೆ ಪರಿವರ್ತನೆ, ಹೆಚ್ಚುವರಿ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗಳಿಗೆ ಬೆಂಬಲ, ವಿಸ್ತರಿತ ಬಿಟ್ರೇಟ್ ನಿಯಂತ್ರಣ ಸಾಮರ್ಥ್ಯಗಳು, ಸುಧಾರಿತ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಆಡಿಯೊ ಗುಣಮಟ್ಟವನ್ನು ಒಳಗೊಂಡಿದೆ. ಉಲ್ಲೇಖ ಕೋಡ್ ಅನುಷ್ಠಾನವನ್ನು C++ ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು Apache 2.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ.

ಕಡಿಮೆ ವೇಗದಲ್ಲಿ ಪ್ರಸಾರವಾಗುವ ಧ್ವನಿ ಡೇಟಾದ ಗುಣಮಟ್ಟಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ, ಡಿಜಿಟಲ್ ಸಿಗ್ನಲ್ ಸಂಸ್ಕರಣಾ ವಿಧಾನಗಳನ್ನು ಬಳಸುವ ಸಾಂಪ್ರದಾಯಿಕ ಕೊಡೆಕ್‌ಗಳಿಗಿಂತ ಲೈರಾ ಗಮನಾರ್ಹವಾಗಿ ಉತ್ತಮವಾಗಿದೆ. ಸೀಮಿತ ಪ್ರಮಾಣದ ರವಾನೆಯಾದ ಮಾಹಿತಿಯ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಧ್ವನಿ ಪ್ರಸರಣವನ್ನು ಸಾಧಿಸಲು, ಆಡಿಯೊ ಕಂಪ್ರೆಷನ್ ಮತ್ತು ಸಿಗ್ನಲ್ ಪರಿವರ್ತನೆಯ ಸಾಂಪ್ರದಾಯಿಕ ವಿಧಾನಗಳ ಜೊತೆಗೆ, ಲೈರಾ ಯಂತ್ರ ಕಲಿಕೆಯ ವ್ಯವಸ್ಥೆಯನ್ನು ಆಧರಿಸಿ ಭಾಷಣ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ, ಇದು ಕಾಣೆಯಾದ ಮಾಹಿತಿಯನ್ನು ಆಧರಿಸಿ ಮರುಸೃಷ್ಟಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ವಿಶಿಷ್ಟ ಭಾಷಣ ಗುಣಲಕ್ಷಣಗಳು.

ಕೊಡೆಕ್ ಎನ್‌ಕೋಡರ್ ಮತ್ತು ಡಿಕೋಡರ್ ಅನ್ನು ಒಳಗೊಂಡಿದೆ. ಎನ್‌ಕೋಡರ್‌ನ ಅಲ್ಗಾರಿದಮ್ ಪ್ರತಿ 20 ಮಿಲಿಸೆಕೆಂಡ್‌ಗಳಿಗೆ ಧ್ವನಿ ಡೇಟಾ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯಲು ಕುದಿಯುತ್ತದೆ ಮತ್ತು 3.2kbps ನಿಂದ 9.2kbps ವರೆಗಿನ ಬಿಟ್ರೇಟ್‌ನೊಂದಿಗೆ ನೆಟ್‌ವರ್ಕ್ ಮೂಲಕ ಸ್ವೀಕರಿಸುವವರಿಗೆ ರವಾನಿಸುತ್ತದೆ. ರಿಸೀವರ್ ತುದಿಯಲ್ಲಿ, ಡಿಕೋಡರ್ ಪ್ರಸರಣಗೊಂಡ ಆಡಿಯೊ ನಿಯತಾಂಕಗಳ ಆಧಾರದ ಮೇಲೆ ಮೂಲ ಭಾಷಣ ಸಂಕೇತವನ್ನು ಪುನರ್ನಿರ್ಮಿಸಲು ಉತ್ಪಾದಕ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ, ಇದರಲ್ಲಿ ಲಾಗರಿಥಮಿಕ್ ಚಾಕ್ ಸ್ಪೆಕ್ಟ್ರೋಗ್ರಾಮ್‌ಗಳು ವಿಭಿನ್ನ ಆವರ್ತನ ಶ್ರೇಣಿಗಳಲ್ಲಿ ಮಾತಿನ ಶಕ್ತಿ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ಖಾತೆಯ ಮಾದರಿಗಳನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಂಡು ತಯಾರಿಸಲಾಗುತ್ತದೆ. ಮಾನವ ಶ್ರವಣೇಂದ್ರಿಯ ಗ್ರಹಿಕೆ.

ಲೈರಾ V2 ಸೌಂಡ್‌ಸ್ಟ್ರೀಮ್ ಕನ್ವಲ್ಯೂಷನಲ್ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ಅನ್ನು ಆಧರಿಸಿ ಹೊಸ ಉತ್ಪಾದಕ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ, ಇದು ಕಡಿಮೆ ಕಂಪ್ಯೂಟೇಶನಲ್ ಅವಶ್ಯಕತೆಗಳನ್ನು ಹೊಂದಿದೆ, ಕಡಿಮೆ-ಶಕ್ತಿಯ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿಯೂ ಸಹ ನೈಜ-ಸಮಯದ ಡಿಕೋಡಿಂಗ್ ಅನ್ನು ಅನುಮತಿಸುತ್ತದೆ. ಧ್ವನಿಯನ್ನು ಉತ್ಪಾದಿಸಲು ಬಳಸಿದ ಮಾದರಿಯು 90 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳಲ್ಲಿ ಹಲವಾರು ಸಾವಿರ ಗಂಟೆಗಳ ಧ್ವನಿ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ತರಬೇತಿ ಪಡೆದಿದೆ. ಮಾದರಿಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸಲು TensorFlow ಲೈಟ್ ಅನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಪ್ರಸ್ತಾವಿತ ಅನುಷ್ಠಾನದ ಕಾರ್ಯಕ್ಷಮತೆ ಕಡಿಮೆ ಬೆಲೆಯ ಶ್ರೇಣಿಯಲ್ಲಿ ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ಗಳಲ್ಲಿ ಭಾಷಣ ಎನ್‌ಕೋಡಿಂಗ್ ಮತ್ತು ಡಿಕೋಡಿಂಗ್‌ಗೆ ಸಾಕಾಗುತ್ತದೆ.

ವಿಭಿನ್ನ ಉತ್ಪಾದಕ ಮಾದರಿಯನ್ನು ಬಳಸುವುದರ ಜೊತೆಗೆ, ಹೊಸ ಆವೃತ್ತಿಯು RVQ (ರೆಸಿಡ್ಯೂಯಲ್ ವೆಕ್ಟರ್ ಕ್ವಾಂಟೈಜರ್) ಕ್ವಾಂಟೈಜರ್‌ನೊಂದಿಗಿನ ಲಿಂಕ್‌ಗಳ ಕೋಡೆಕ್ ಆರ್ಕಿಟೆಕ್ಚರ್‌ನಲ್ಲಿ ಸೇರ್ಪಡೆಗಾಗಿ ಗಮನಾರ್ಹವಾಗಿದೆ, ಇದು ಡೇಟಾವನ್ನು ರವಾನಿಸುವ ಮೊದಲು ಕಳುಹಿಸುವವರ ಬದಿಯಲ್ಲಿ ಮತ್ತು ಸ್ವೀಕರಿಸುವವರ ಬದಿಯಲ್ಲಿ ಕಾರ್ಯಗತಗೊಳ್ಳುತ್ತದೆ. ಡೇಟಾವನ್ನು ಸ್ವೀಕರಿಸಿದ ನಂತರ. ಕ್ವಾಂಟೈಜರ್ ಕೊಡೆಕ್‌ನಿಂದ ಉತ್ಪತ್ತಿಯಾಗುವ ನಿಯತಾಂಕಗಳನ್ನು ಪ್ಯಾಕೆಟ್‌ಗಳ ಸೆಟ್‌ಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ, ಆಯ್ದ ಬಿಟ್ರೇಟ್‌ಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಮಾಹಿತಿಯನ್ನು ಎನ್‌ಕೋಡಿಂಗ್ ಮಾಡುತ್ತದೆ. ವಿವಿಧ ಹಂತದ ಗುಣಮಟ್ಟವನ್ನು ಒದಗಿಸಲು, ಮೂರು ಬಿಟ್ರೇಟ್‌ಗಳಿಗೆ (3.2 kps, 6 kbps ಮತ್ತು 9.2 kbps) ಕ್ವಾಂಟೈಜರ್‌ಗಳನ್ನು ಒದಗಿಸಲಾಗುತ್ತದೆ, ಹೆಚ್ಚಿನ ಬಿಟ್ರೇಟ್, ಉತ್ತಮ ಗುಣಮಟ್ಟ, ಆದರೆ ಹೆಚ್ಚಿನ ಬ್ಯಾಂಡ್‌ವಿಡ್ತ್ ಅಗತ್ಯತೆಗಳು.

ಗೂಗಲ್ ಲೈರಾ ವಿ2 ಓಪನ್ ಸೋರ್ಸ್ ಆಡಿಯೊ ಕೊಡೆಕ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತದೆ

ಹೊಸ ಆರ್ಕಿಟೆಕ್ಚರ್ ಸಿಗ್ನಲ್ ಟ್ರಾನ್ಸ್ಮಿಷನ್ ವಿಳಂಬವನ್ನು 100 ರಿಂದ 20 ಮಿಲಿಸೆಕೆಂಡುಗಳಿಗೆ ಕಡಿಮೆ ಮಾಡಿದೆ. ಹೋಲಿಕೆಗಾಗಿ, WebRTC ಗಾಗಿ ಓಪಸ್ ಕೊಡೆಕ್ ಪರೀಕ್ಷಿತ ಬಿಟ್ರೇಟ್‌ಗಳಲ್ಲಿ 26.5ms, 46.5ms ಮತ್ತು 66.5ms ನಷ್ಟು ಲೇಟೆನ್ಸಿಗಳನ್ನು ಪ್ರದರ್ಶಿಸಿದೆ. ಎನ್‌ಕೋಡರ್ ಮತ್ತು ಡಿಕೋಡರ್‌ನ ಕಾರ್ಯಕ್ಷಮತೆಯು ಗಮನಾರ್ಹವಾಗಿ ಹೆಚ್ಚಾಗಿದೆ - ಹಿಂದಿನ ಆವೃತ್ತಿಗೆ ಹೋಲಿಸಿದರೆ 5 ಪಟ್ಟು ವೇಗವಾಗಿ. ಉದಾಹರಣೆಗೆ, ಪಿಕ್ಸೆಲ್ 6 ಪ್ರೊ ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ನಲ್ಲಿ, ಹೊಸ ಕೊಡೆಕ್ 20-ಎಂಎಸ್ ಮಾದರಿಯನ್ನು 0.57 ಎಂಎಸ್‌ನಲ್ಲಿ ಎನ್‌ಕೋಡ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಡಿಕೋಡ್ ಮಾಡುತ್ತದೆ, ಇದು ನೈಜ-ಸಮಯದ ಪ್ರಸರಣಕ್ಕೆ ಅಗತ್ಯಕ್ಕಿಂತ 35 ಪಟ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ.

ಕಾರ್ಯಕ್ಷಮತೆಯ ಜೊತೆಗೆ, ಧ್ವನಿ ಮರುಸ್ಥಾಪನೆಯ ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸಲು ಸಹ ಸಾಧ್ಯವಾಯಿತು - ಮುಶ್ರಾ ಸ್ಕೇಲ್ ಪ್ರಕಾರ, ಲೈರಾ ವಿ 3.2 ಕೊಡೆಕ್ ಅನ್ನು ಬಳಸುವಾಗ 6 ಕೆಬಿಪಿಎಸ್, 9.2 ಕೆಬಿಪಿಎಸ್ ಮತ್ತು 2 ಕೆಬಿಪಿಎಸ್ ಬಿಟ್ರೇಟ್‌ಗಳಲ್ಲಿ ಮಾತಿನ ಗುಣಮಟ್ಟವು 10 ಕೆಬಿಪಿಎಸ್, 13 ರ ಬಿಟ್ರೇಟ್‌ಗಳಿಗೆ ಅನುರೂಪವಾಗಿದೆ. ಓಪಸ್ ಕೊಡೆಕ್ ಬಳಸುವಾಗ ಕೆಬಿಪಿಎಸ್ ಮತ್ತು 14 ಕೆಬಿಪಿಎಸ್.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ