RHVoice 1.8.0 ಸ್ಪೀಚ್ ಸಿಂಥಸೈಜರ್ ಬಿಡುಗಡೆಯಾಗಿದೆ

ಓಪನ್ ಸ್ಪೀಚ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ RHVoice 1.8.0 ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲಾಯಿತು, ಆರಂಭದಲ್ಲಿ ರಷ್ಯನ್ ಭಾಷೆಗೆ ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಬೆಂಬಲವನ್ನು ಒದಗಿಸಲು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಯಿತು, ಆದರೆ ನಂತರ ಇಂಗ್ಲಿಷ್, ಪೋರ್ಚುಗೀಸ್, ಉಕ್ರೇನಿಯನ್, ಕಿರ್ಗಿಜ್, ಟಾಟರ್ ಮತ್ತು ಜಾರ್ಜಿಯನ್ ಸೇರಿದಂತೆ ಇತರ ಭಾಷೆಗಳಿಗೆ ಅಳವಡಿಸಲಾಯಿತು. ಕೋಡ್ ಅನ್ನು C++ ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು LGPL 2.1 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ. GNU/Linux, Windows ಮತ್ತು Android ನಲ್ಲಿ ಕೆಲಸವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಪಠ್ಯವನ್ನು ಭಾಷಣಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಪ್ರೋಗ್ರಾಂ ಪ್ರಮಾಣಿತ TTS (ಪಠ್ಯದಿಂದ ಭಾಷಣ) ​​ಇಂಟರ್ಫೇಸ್‌ಗಳೊಂದಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ: SAPI5 (Windows), ಸ್ಪೀಚ್ ಡಿಸ್ಪ್ಯಾಚರ್ (GNU/Linux) ಮತ್ತು Android ಪಠ್ಯದಿಂದ ಭಾಷಣ API, ಆದರೆ NVDA ಯಲ್ಲಿಯೂ ಬಳಸಬಹುದು ಸ್ಕ್ರೀನ್ ರೀಡರ್. RHVoice ನ ಸೃಷ್ಟಿಕರ್ತ ಮತ್ತು ಮುಖ್ಯ ಡೆವಲಪರ್ ಓಲ್ಗಾ ಯಾಕೋವ್ಲೆವಾ, ಅವರು ಸಂಪೂರ್ಣವಾಗಿ ಕುರುಡರಾಗಿದ್ದರೂ ಯೋಜನೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತಾರೆ.

ಆಂಡ್ರಾಯ್ಡ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗಾಗಿ ಆವೃತ್ತಿ 1.8 ಹೊಸ ಧ್ವನಿ ಮತ್ತು ಭಾಷಾ ಡೇಟಾ ನಿರ್ವಹಣಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ ಅದು ಮೊಬೈಲ್ ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ನವೀಕರಿಸದೆಯೇ ಧ್ವನಿ ಡೇಟಾ ನವೀಕರಣಗಳನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ಸೇರಿಸಲಾದ ಧ್ವನಿಗಳು ಮತ್ತು ಭಾಷೆಗಳಿಗೆ ಡೇಟಾ ನವೀಕರಣಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪರಿಶೀಲಿಸಲಾಗುತ್ತದೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ಹೊಸ ಬಿಡುಗಡೆಯು ಪೋಲಿಷ್ ಭಾಷೆಗೆ ಬೆಂಬಲವನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ ಮತ್ತು ಮೆಸಿಡೋನಿಯನ್ ಭಾಷೆಗೆ ಹೊಸ ಧ್ವನಿಯನ್ನು ಸೇರಿಸುತ್ತದೆ. NVDA ಸ್ಕ್ರೀನ್ ರೀಡರ್‌ನ ಇತ್ತೀಚಿನ ಆಲ್ಫಾ ಮತ್ತು ಬೀಟಾ ಬಿಡುಗಡೆಗಳೊಂದಿಗೆ ಹೊಂದಾಣಿಕೆಯನ್ನು ಖಾತ್ರಿಪಡಿಸಲಾಗಿದೆ. ಸ್ಪೀಚ್ ಡಿಸ್ಪ್ಯಾಚರ್ ಇಲ್ಲದಿದ್ದಾಗ ಸಂಭವಿಸಿದ ಲಿನಕ್ಸ್ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ನಲ್ಲಿ ನಿರ್ಮಿಸುವ ಸ್ಥಿರ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.

RHVoice HTS ಯೋಜನೆಯ ಬೆಳವಣಿಗೆಗಳನ್ನು (HMM/DNN-ಆಧಾರಿತ ಸ್ಪೀಚ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್) ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳೊಂದಿಗೆ ಪ್ಯಾರಾಮೆಟ್ರಿಕ್ ಸಿಂಥೆಸಿಸ್ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತದೆ ಎಂದು ನಾವು ನೆನಪಿಸಿಕೊಳ್ಳೋಣ (HMM ಆಧಾರಿತ ಸ್ಟ್ಯಾಟಿಸ್ಟಿಕಲ್ ಪ್ಯಾರಾಮೆಟ್ರಿಕ್ ಸಿಂಥೆಸಿಸ್ - ಹಿಡನ್ ಮಾರ್ಕೊವ್ ಮಾದರಿ). ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಮಾದರಿಯ ಪ್ರಯೋಜನವೆಂದರೆ ಕಡಿಮೆ ಓವರ್ಹೆಡ್ ವೆಚ್ಚಗಳು ಮತ್ತು ಬೇಡಿಕೆಯಿಲ್ಲದ CPU ಶಕ್ತಿ. ಎಲ್ಲಾ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಬಳಕೆದಾರರ ಸಿಸ್ಟಂನಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ. ಮೂರು ಹಂತದ ಮಾತಿನ ಗುಣಮಟ್ಟವನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ (ಕಡಿಮೆ ಗುಣಮಟ್ಟ, ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಕಡಿಮೆ ಪ್ರತಿಕ್ರಿಯೆ ಸಮಯ).

ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯ ತೊಂದರೆಯು ಉಚ್ಚಾರಣೆಯ ತುಲನಾತ್ಮಕವಾಗಿ ಕಡಿಮೆ ಗುಣಮಟ್ಟವಾಗಿದೆ, ಇದು ನೈಸರ್ಗಿಕ ಭಾಷಣದ ತುಣುಕುಗಳ ಸಂಯೋಜನೆಯ ಆಧಾರದ ಮೇಲೆ ಭಾಷಣವನ್ನು ಉತ್ಪಾದಿಸುವ ಸಿಂಥಸೈಜರ್‌ಗಳ ಮಟ್ಟವನ್ನು ತಲುಪುವುದಿಲ್ಲ, ಆದರೆ ಫಲಿತಾಂಶವು ಸಾಕಷ್ಟು ಸ್ಪಷ್ಟವಾಗಿರುತ್ತದೆ ಮತ್ತು ಧ್ವನಿವರ್ಧಕದಿಂದ ಧ್ವನಿಮುದ್ರಣವನ್ನು ಪ್ರಸಾರ ಮಾಡುವುದನ್ನು ಹೋಲುತ್ತದೆ. . ಹೋಲಿಕೆಗಾಗಿ, ಯಂತ್ರ ಕಲಿಕೆ ತಂತ್ರಜ್ಞಾನಗಳು ಮತ್ತು ರಷ್ಯನ್ ಭಾಷೆಗೆ ಮಾದರಿಗಳ ಒಂದು ಸೆಟ್ ಅನ್ನು ಆಧರಿಸಿ ಮುಕ್ತ ಭಾಷಣ ಸಂಶ್ಲೇಷಣೆ ಎಂಜಿನ್ ಅನ್ನು ಒದಗಿಸುವ ಸಿಲೆರೊ ಯೋಜನೆಯು RHVoice ಗೆ ಗುಣಮಟ್ಟದಲ್ಲಿ ಉತ್ತಮವಾಗಿದೆ.

ರಷ್ಯನ್ ಭಾಷೆಗೆ 14 ಧ್ವನಿ ಆಯ್ಕೆಗಳು ಲಭ್ಯವಿವೆ, ಮತ್ತು ಇಂಗ್ಲಿಷ್‌ಗೆ 6. ಸಹಜ ಮಾತಿನ ಧ್ವನಿಮುದ್ರಣಗಳ ಆಧಾರದ ಮೇಲೆ ಧ್ವನಿಗಳನ್ನು ರಚಿಸಲಾಗಿದೆ. ಸೆಟ್ಟಿಂಗ್‌ಗಳಲ್ಲಿ ನೀವು ವೇಗ, ಪಿಚ್ ಮತ್ತು ಪರಿಮಾಣವನ್ನು ಬದಲಾಯಿಸಬಹುದು. ಗತಿಯನ್ನು ಬದಲಾಯಿಸಲು ಸೋನಿಕ್ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಬಹುದು. ಇನ್‌ಪುಟ್ ಪಠ್ಯದ ವಿಶ್ಲೇಷಣೆಯ ಆಧಾರದ ಮೇಲೆ ಭಾಷೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಬದಲಾಯಿಸಲು ಸಾಧ್ಯವಿದೆ (ಉದಾಹರಣೆಗೆ, ಇನ್ನೊಂದು ಭಾಷೆಯಲ್ಲಿ ಪದಗಳು ಮತ್ತು ಉಲ್ಲೇಖಗಳಿಗಾಗಿ, ಆ ಭಾಷೆಗೆ ಸ್ಥಳೀಯವಾದ ಸಿಂಥೆಸಿಸ್ ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದು). ಧ್ವನಿ ಪ್ರೊಫೈಲ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ, ವಿವಿಧ ಭಾಷೆಗಳಿಗೆ ಧ್ವನಿಗಳ ಸಂಯೋಜನೆಯನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತದೆ.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ