RHVoice 1.6.0 කථන සංස්ෙල්ෂක නිකුතුව

විවෘත කථන ​​සංස්ලේෂණ පද්ධතිය RHVoice 1.6.0 නිකුත් කරන ලදී, මුලින් රුසියානු භාෂාව සඳහා උසස් තත්ත්වයේ සහය සැපයීම සඳහා සංවර්ධනය කරන ලදී, නමුත් පසුව ඉංග්‍රීසි, පෘතුගීසි, යුක්රේනියානු, කිර්ගිස්, ටාටාර් සහ ජෝර්ජියානු ඇතුළු අනෙකුත් භාෂා සඳහා අනුවර්තනය කරන ලදී. කේතය C++ වලින් ලියා LGPL 2.1 බලපත්‍රය යටතේ බෙදා හැර ඇත. GNU/Linux, Windows සහ Android මත වැඩ කිරීමට සහය දක්වයි. මෙම වැඩසටහන පෙළ කථනයට පරිවර්තනය කිරීම සඳහා සම්මත TTS (පෙළ සිට කථනය) අතුරුමුහුණත් සමඟ අනුකූල වේ: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) සහ Android Text-to-Speech API, නමුත් NVDA හි ද භාවිතා කළ හැක. තිර කියවනය. RHVoice හි නිර්මාතෘ සහ ප්‍රධාන සංවර්ධකයා Olga Yakovleva වන අතර ඔහු සම්පූර්ණයෙන්ම අන්ධ වුවද ව්‍යාපෘතිය සංවර්ධනය කරයි.

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

RHVoice විසින් HTS ව්‍යාපෘතියේ වර්ධනයන් (HMM/DNN මත පදනම් වූ කථන සංස්ලේෂණ පද්ධතිය) සහ සංඛ්‍යාන ආකෘති සමඟ පරාමිතික සංශ්ලේෂණ ක්‍රමය (HMM මත පදනම් වූ සංඛ්‍යාන පරාමිතික සංශ්ලේෂණය - සැඟවුණු මාර්කොව් ආකෘතිය) භාවිතා කරන බව අපි සිහිපත් කරමු. සංඛ්‍යානමය ආකෘතියේ වාසිය නම් අඩු පොදු කාර්ය පිරිවැය සහ අනවශ්‍ය CPU බලයයි. සියලුම මෙහෙයුම් පරිශීලකයාගේ පද්ධතිය මත දේශීයව සිදු කෙරේ. කථන ගුණාත්මක මට්ටම් තුනකට සහය දක්වයි (අඩු ගුණාත්මක භාවය, ඉහළ කාර්ය සාධනය සහ කෙටි ප්රතික්රියා කාලය).

සංඛ්‍යානමය ආකෘතියේ අවාසිය නම් උච්චාරණයේ සාපේක්ෂ අඩු ගුණාත්මක භාවය වන අතර එය ස්වභාවික කථනයේ කොටස්වල එකතුවක් මත පදනම්ව කථනය ජනනය කරන සංස්ලේෂක මට්ටමට නොපැමිණෙන නමුත් ප්‍රති result ලය තරමක් පැහැදිලිව පෙනෙන අතර ශබ්ද විකාශන යන්ත්‍රයකින් පටිගත කිරීමක් විකාශනය කිරීමට සමාන වේ. . සංසන්දනය කිරීම සඳහා, යන්ත්‍ර ඉගෙනුම් තාක්ෂණයන් මත පදනම් වූ විවෘත කථන ​​සංස්ලේෂණ එන්ජිමක් සහ රුසියානු භාෂාව සඳහා ආකෘති කට්ටලයක් සපයන සිලෙරෝ ව්‍යාපෘතිය RHVoice වලට වඩා ගුණාත්මක බවින් උසස් වේ.

රුසියානු භාෂාව සඳහා 13 කටහඬ විකල්ප ඇත, සහ ඉංග්රීසි සඳහා 5. කටහඬ සෑදී ඇත්තේ ස්වභාවික කථාවේ පටිගත කිරීම් මත පදනම්වය. සැකසුම් තුළ ඔබට වේගය, තාරතාව සහ පරිමාව වෙනස් කළ හැකිය. ටෙම්පෝ වෙනස් කිරීමට Sonic පුස්තකාලය භාවිතා කළ හැක. ආදාන පෙළ විශ්ලේෂණය මත පදනම්ව භාෂා ස්වයංක්‍රීයව හඳුනාගෙන මාරු කළ හැකිය (උදාහරණයක් ලෙස, වෙනත් භාෂාවක වචන සහ උපුටා දැක්වීම් සඳහා, එම භාෂාවට ආවේණික සංස්ලේෂණ ආකෘතියක් භාවිතා කළ හැකිය). විවිධ භාෂා සඳහා හඬ සංයෝජන නිර්වචනය කරමින් හඬ පැතිකඩවලට සහය දක්වයි.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න