RHVoice 1.8.0 කථන සංස්ෙල්ෂක නිකුතුව

විවෘත කථන ​​සංස්ලේෂණ පද්ධතිය RHVoice 1.8.0 නිකුත් කරන ලදී, මුලින් රුසියානු භාෂාව සඳහා උසස් තත්ත්වයේ සහය සැපයීම සඳහා සංවර්ධනය කරන ලදී, නමුත් පසුව ඉංග්‍රීසි, පෘතුගීසි, යුක්රේනියානු, කිර්ගිස්, ටාටාර් සහ ජෝර්ජියානු ඇතුළු අනෙකුත් භාෂා සඳහා අනුවර්තනය කරන ලදී. කේතය C++ වලින් ලියා LGPL 2.1 බලපත්‍රය යටතේ බෙදා හැර ඇත. GNU/Linux, Windows සහ Android මත වැඩ කිරීමට සහය දක්වයි. මෙම වැඩසටහන පෙළ කථනයට පරිවර්තනය කිරීම සඳහා සම්මත TTS (පෙළ සිට කථනය) අතුරුමුහුණත් සමඟ අනුකූල වේ: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) සහ Android Text-to-Speech API, නමුත් NVDA හි ද භාවිතා කළ හැක. තිර කියවනය. RHVoice හි නිර්මාතෘ සහ ප්‍රධාන සංවර්ධකයා Olga Yakovleva වන අතර ඔහු සම්පූර්ණයෙන්ම අන්ධ වුවද ව්‍යාපෘතිය සංවර්ධනය කරයි.

Android වේදිකාව සඳහා වන 1.8 අනුවාදය ජංගම යෙදුම යාවත්කාලීන නොකර හඬ දත්ත යාවත්කාලීන බාගත කිරීමට ඉඩ සලසන නව හඬ සහ භාෂා දත්ත කළමනාකරණ පද්ධතියක් හඳුන්වා දෙයි. එකතු කරන ලද හඬ සහ භාෂා සඳහා දත්ත යාවත්කාලීන ස්වයංක්‍රීයව පරීක්ෂා කෙරේ. මීට අමතරව, නව නිකුතුව පෝලන්ත භාෂාව සඳහා සහය හඳුන්වා දෙන අතර මැසිඩෝනියානු භාෂාව සඳහා නව හඬක් එක් කරයි. NVDA තිර කියවනයේ නවතම ඇල්ෆා සහ බීටා නිකුතු සමඟ ගැළපීම සහතික කෙරේ. කථන ඩිස්පැචර් නොමැති විට ඇති වූ ලිනක්ස් වේදිකාව මත ගොඩනැගීමේ ස්ථාවර ගැටළු.

RHVoice විසින් HTS ව්‍යාපෘතියේ වර්ධනයන් (HMM/DNN මත පදනම් වූ කථන සංස්ලේෂණ පද්ධතිය) සහ සංඛ්‍යාන ආකෘති සමඟ පරාමිතික සංශ්ලේෂණ ක්‍රමය (HMM මත පදනම් වූ සංඛ්‍යාන පරාමිතික සංශ්ලේෂණය - සැඟවුණු මාර්කොව් ආකෘතිය) භාවිතා කරන බව අපි සිහිපත් කරමු. සංඛ්‍යානමය ආකෘතියේ වාසිය නම් අඩු පොදු කාර්ය පිරිවැය සහ අනවශ්‍ය CPU බලයයි. සියලුම මෙහෙයුම් පරිශීලකයාගේ පද්ධතිය මත දේශීයව සිදු කෙරේ. කථන ගුණාත්මක මට්ටම් තුනකට සහය දක්වයි (අඩු ගුණාත්මක භාවය, ඉහළ කාර්ය සාධනය සහ කෙටි ප්රතික්රියා කාලය).

සංඛ්‍යානමය ආකෘතියේ අවාසිය නම් උච්චාරණයේ සාපේක්ෂ අඩු ගුණාත්මක භාවය වන අතර එය ස්වභාවික කථනයේ කොටස්වල එකතුවක් මත පදනම්ව කථනය ජනනය කරන සංස්ලේෂක මට්ටමට නොපැමිණෙන නමුත් ප්‍රති result ලය තරමක් පැහැදිලිව පෙනෙන අතර ශබ්ද විකාශන යන්ත්‍රයකින් පටිගත කිරීමක් විකාශනය කිරීමට සමාන වේ. . සංසන්දනය කිරීම සඳහා, යන්ත්‍ර ඉගෙනුම් තාක්ෂණයන් මත පදනම් වූ විවෘත කථන ​​සංස්ලේෂණ එන්ජිමක් සහ රුසියානු භාෂාව සඳහා ආකෘති කට්ටලයක් සපයන සිලෙරෝ ව්‍යාපෘතිය RHVoice වලට වඩා ගුණාත්මක බවින් උසස් වේ.

රුසියානු භාෂාව සඳහා 14 කටහඬ විකල්ප ඇත, සහ ඉංග්රීසි සඳහා 6. කටහඬ සෑදී ඇත්තේ ස්වභාවික කථාවේ පටිගත කිරීම් මත පදනම්වය. සැකසුම් තුළ ඔබට වේගය, තාරතාව සහ පරිමාව වෙනස් කළ හැකිය. ටෙම්පෝ වෙනස් කිරීමට Sonic පුස්තකාලය භාවිතා කළ හැක. ආදාන පෙළ විශ්ලේෂණය මත පදනම්ව භාෂා ස්වයංක්‍රීයව හඳුනාගෙන මාරු කළ හැකිය (උදාහරණයක් ලෙස, වෙනත් භාෂාවක වචන සහ උපුටා දැක්වීම් සඳහා, එම භාෂාවට ආවේණික සංස්ලේෂණ ආකෘතියක් භාවිතා කළ හැකිය). විවිධ භාෂා සඳහා හඬ සංයෝජන නිර්වචනය කරමින් හඬ පැතිකඩවලට සහය දක්වයි.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න