RHVoice 1.6.0 ಸ್ಪೀಚ್ ಸಿಂಥಸೈಜರ್ ಬಿಡುಗಡೆಯಾಗಿದೆ

RHVoice 1.6.0, ಒಂದು ಓಪನ್-ಸೋರ್ಸ್ ಸ್ಪೀಚ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲಾಗಿದೆ. ಆರಂಭದಲ್ಲಿ ರಷ್ಯನ್ ಭಾಷೆಗೆ ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಬೆಂಬಲವನ್ನು ಒದಗಿಸಲು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಯಿತು, ನಂತರ ಇದನ್ನು ಇಂಗ್ಲಿಷ್, ಪೋರ್ಚುಗೀಸ್, ಉಕ್ರೇನಿಯನ್, ಕಿರ್ಗಿಜ್, ಟಾಟರ್ ಮತ್ತು ಜಾರ್ಜಿಯನ್ ಸೇರಿದಂತೆ ಇತರ ಭಾಷೆಗಳಿಗೆ ಅಳವಡಿಸಲಾಗಿದೆ. ಕೋಡ್ ಅನ್ನು C++ ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು LGPL 2.1 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ. GNU/Linux ಬೆಂಬಲವನ್ನು ಸಹ ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ.Linux, Windows и Androidಪಠ್ಯವನ್ನು ಭಾಷಣಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಈ ಪ್ರೋಗ್ರಾಂ ವಿಶಿಷ್ಟವಾದ TTS (ಪಠ್ಯದಿಂದ ಭಾಷಣ) ​​ಇಂಟರ್ಫೇಸ್‌ಗಳೊಂದಿಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ: SAPI5 (Windows), ಸ್ಪೀಚ್ ಡಿಸ್ಪ್ಯಾಚರ್ (GNU/Linux) ಮತ್ತು Android ಪಠ್ಯದಿಂದ ಭಾಷಣ API, ಆದರೆ NVDA ಸ್ಕ್ರೀನ್ ರೀಡರ್‌ನೊಂದಿಗೆ ಸಹ ಬಳಸಬಹುದು. RHVoice ನ ಸೃಷ್ಟಿಕರ್ತ ಮತ್ತು ಮುಖ್ಯ ಡೆವಲಪರ್ ಓಲ್ಗಾ ಯಾಕೋವ್ಲೆವಾ, ಅವರು ಸಂಪೂರ್ಣವಾಗಿ ಕುರುಡರಾಗಿದ್ದರೂ ಸಹ ಯೋಜನೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವುದನ್ನು ಮುಂದುವರಿಸಿದ್ದಾರೆ.

ಹೊಸ ಆವೃತ್ತಿಯು ರಷ್ಯನ್ ಭಾಷಣಕ್ಕಾಗಿ 5 ಹೊಸ ಧ್ವನಿ ಆಯ್ಕೆಗಳನ್ನು ಸೇರಿಸುತ್ತದೆ. ಅಲ್ಬೇನಿಯನ್ ಭಾಷಾ ಬೆಂಬಲವನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ. ಉಕ್ರೇನಿಯನ್ ನಿಘಂಟನ್ನು ನವೀಕರಿಸಲಾಗಿದೆ. ಎಮೋಜಿ ಉಚ್ಚಾರಣೆಗೆ ಬೆಂಬಲವನ್ನು ವಿಸ್ತರಿಸಲಾಗಿದೆ. ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಅಪ್ಲಿಕೇಶನ್‌ನಲ್ಲಿ ದೋಷ ಪರಿಹಾರಗಳನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ. Android, ಬಳಕೆದಾರ ನಿಘಂಟುಗಳ ಆಮದು ಸರಳೀಕರಿಸಲಾಗಿದೆ ಮತ್ತು ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಬೆಂಬಲವನ್ನು ಸೇರಿಸಲಾಗಿದೆ Android 11. ಎಂಜಿನ್ ಕೋರ್‌ಗೆ ಹೊಸ ಸೆಟ್ಟಿಂಗ್‌ಗಳು ಮತ್ತು ಕಾರ್ಯವನ್ನು ಸೇರಿಸಲಾಗಿದೆ, ಇದರಲ್ಲಿ g2p.case, word_break, ಮತ್ತು ಈಕ್ವಲೈಸೇಶನ್ ಫಿಲ್ಟರ್‌ಗಳಿಗೆ ಬೆಂಬಲ ಸೇರಿವೆ.

RHVoice HTS ಯೋಜನೆಯ ಬೆಳವಣಿಗೆಗಳನ್ನು (HMM/DNN-ಆಧಾರಿತ ಸ್ಪೀಚ್ ಸಿಂಥೆಸಿಸ್ ಸಿಸ್ಟಮ್) ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳೊಂದಿಗೆ ಪ್ಯಾರಾಮೆಟ್ರಿಕ್ ಸಿಂಥೆಸಿಸ್ ವಿಧಾನವನ್ನು ಬಳಸುತ್ತದೆ ಎಂದು ನಾವು ನೆನಪಿಸಿಕೊಳ್ಳೋಣ (HMM ಆಧಾರಿತ ಸ್ಟ್ಯಾಟಿಸ್ಟಿಕಲ್ ಪ್ಯಾರಾಮೆಟ್ರಿಕ್ ಸಿಂಥೆಸಿಸ್ - ಹಿಡನ್ ಮಾರ್ಕೊವ್ ಮಾದರಿ). ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಮಾದರಿಯ ಪ್ರಯೋಜನವೆಂದರೆ ಕಡಿಮೆ ಓವರ್ಹೆಡ್ ವೆಚ್ಚಗಳು ಮತ್ತು ಬೇಡಿಕೆಯಿಲ್ಲದ CPU ಶಕ್ತಿ. ಎಲ್ಲಾ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಬಳಕೆದಾರರ ಸಿಸ್ಟಂನಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ. ಮೂರು ಹಂತದ ಮಾತಿನ ಗುಣಮಟ್ಟವನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ (ಕಡಿಮೆ ಗುಣಮಟ್ಟ, ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಕಡಿಮೆ ಪ್ರತಿಕ್ರಿಯೆ ಸಮಯ).

ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯ ತೊಂದರೆಯು ಉಚ್ಚಾರಣೆಯ ತುಲನಾತ್ಮಕವಾಗಿ ಕಡಿಮೆ ಗುಣಮಟ್ಟವಾಗಿದೆ, ಇದು ನೈಸರ್ಗಿಕ ಭಾಷಣದ ತುಣುಕುಗಳ ಸಂಯೋಜನೆಯ ಆಧಾರದ ಮೇಲೆ ಭಾಷಣವನ್ನು ಉತ್ಪಾದಿಸುವ ಸಿಂಥಸೈಜರ್‌ಗಳ ಮಟ್ಟವನ್ನು ತಲುಪುವುದಿಲ್ಲ, ಆದರೆ ಫಲಿತಾಂಶವು ಸಾಕಷ್ಟು ಸ್ಪಷ್ಟವಾಗಿರುತ್ತದೆ ಮತ್ತು ಧ್ವನಿವರ್ಧಕದಿಂದ ಧ್ವನಿಮುದ್ರಣವನ್ನು ಪ್ರಸಾರ ಮಾಡುವುದನ್ನು ಹೋಲುತ್ತದೆ. . ಹೋಲಿಕೆಗಾಗಿ, ಯಂತ್ರ ಕಲಿಕೆ ತಂತ್ರಜ್ಞಾನಗಳು ಮತ್ತು ರಷ್ಯನ್ ಭಾಷೆಗೆ ಮಾದರಿಗಳ ಒಂದು ಸೆಟ್ ಅನ್ನು ಆಧರಿಸಿ ಮುಕ್ತ ಭಾಷಣ ಸಂಶ್ಲೇಷಣೆ ಎಂಜಿನ್ ಅನ್ನು ಒದಗಿಸುವ ಸಿಲೆರೊ ಯೋಜನೆಯು RHVoice ಗೆ ಗುಣಮಟ್ಟದಲ್ಲಿ ಉತ್ತಮವಾಗಿದೆ.

ರಷ್ಯನ್ ಭಾಷೆಗೆ 13 ಧ್ವನಿ ಆಯ್ಕೆಗಳು ಲಭ್ಯವಿವೆ, ಮತ್ತು ಇಂಗ್ಲಿಷ್‌ಗೆ 5. ಸಹಜ ಮಾತಿನ ಧ್ವನಿಮುದ್ರಣಗಳ ಆಧಾರದ ಮೇಲೆ ಧ್ವನಿಗಳನ್ನು ರಚಿಸಲಾಗಿದೆ. ಸೆಟ್ಟಿಂಗ್‌ಗಳಲ್ಲಿ ನೀವು ವೇಗ, ಪಿಚ್ ಮತ್ತು ಪರಿಮಾಣವನ್ನು ಬದಲಾಯಿಸಬಹುದು. ಗತಿಯನ್ನು ಬದಲಾಯಿಸಲು ಸೋನಿಕ್ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಬಹುದು. ಇನ್‌ಪುಟ್ ಪಠ್ಯದ ವಿಶ್ಲೇಷಣೆಯ ಆಧಾರದ ಮೇಲೆ ಭಾಷೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಬದಲಾಯಿಸಲು ಸಾಧ್ಯವಿದೆ (ಉದಾಹರಣೆಗೆ, ಇನ್ನೊಂದು ಭಾಷೆಯಲ್ಲಿ ಪದಗಳು ಮತ್ತು ಉಲ್ಲೇಖಗಳಿಗಾಗಿ, ಆ ಭಾಷೆಗೆ ಸ್ಥಳೀಯವಾದ ಸಿಂಥೆಸಿಸ್ ಮಾದರಿಯನ್ನು ಬಳಸಬಹುದು). ಧ್ವನಿ ಪ್ರೊಫೈಲ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ, ವಿವಿಧ ಭಾಷೆಗಳಿಗೆ ಧ್ವನಿಗಳ ಸಂಯೋಜನೆಯನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತದೆ.

ಮೂಲ: opennet.ru

DDoS ರಕ್ಷಣೆ, VPS VDS ಸರ್ವರ್‌ಗಳೊಂದಿಗೆ ಸೈಟ್‌ಗಳಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ಹೋಸ್ಟಿಂಗ್ ಅನ್ನು ಖರೀದಿಸಿ 🔥 DDoS ರಕ್ಷಣೆ, VPS VDS ಸರ್ವರ್‌ಗಳೊಂದಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ವೆಬ್‌ಸೈಟ್ ಹೋಸ್ಟಿಂಗ್ ಅನ್ನು ಖರೀದಿಸಿ | ProHoster