Ачык булактуу сүйлөөнү синтездөөчү RHVoice 1.8.0 системасы чыгарылды. Алгач орус тилин жогорку сапатта колдоо үчүн иштелип чыккан, бирок андан бери англис, португал, украин, кыргыз, татар жана грузин тилдери сыяктуу башка тилдерге ылайыкташтырылган. Код C++ тилинде жазылган жана LGPL 2.1 лицензиясы боюнча таратылат. GNU/Linux колдоосу да колдоого алынат.Linux, Windows и AndroidБул программа текстти үнгө айландыруу үчүн типтүү TTS (тексттен үнгө) интерфейстери менен шайкеш келет: SAPI5 (Windows), Сүйлөө диспетчери (GNU/Linux) жана Android Тексттен сүйлөөгө API, бирок NVDA экран окугучу менен да колдонсо болот. RHVoice'тун жаратуучусу жана негизги иштеп чыгуучусу - Ольга Яковлева, ал толугу менен сокур болгонуна карабастан, долбоорду иштеп чыгууну улантууда.
Платформа үчүн 1.8 версиясында Android Мобилдик тиркемени жаңыртпастан үн маалыматтарынын жаңыртууларын жүктөп алууга мүмкүндүк берген жаңы үн жана тил маалыматтарын башкаруу системасы киргизилди. Жаңы кошулган үндөр жана тилдер үчүн жаңыртуулар автоматтык түрдө текшерилет. Мындан тышкары, жаңы чыгарылышка поляк тилин колдоо жана жаңы македон үнү кошулду. NVDA экран окугучунун акыркы альфа жана бета чыгарылыштары менен шайкештик камсыздалды. Платформаны түзүүдөгү көйгөйлөр чечилди. Linux, бул сүйлөө диспетчери жок кезде болгон.
Эске салсак, RHVoice HTS долбоорунун иштеп чыгууларын (HMM/DNN негизиндеги Speech Synthesis System) жана статистикалык моделдер менен параметрдик синтез ыкмасын (HMM негизиндеги статистикалык параметрлик синтез – Жашыруун Марков модели) колдонот. Статистикалык моделдин артыкчылыгы аз ашыкча чыгым жана талап кылынбаган CPU кубаттуулугу. Бардык операциялар колдонуучунун системасында локалдуу түрдө аткарылат. Кептин сапатынын үч деңгээли колдоого алынат (канчалык сапаты төмөн болсо, аткаруу ошончолук жогору жана жооп берүү убактысы ошончолук кыскарат).
Статистикалык моделдин кемчилиги - айтылышынын салыштырмалуу төмөн сапаты, ал табигый кептин фрагменттеринин айкалышынын негизинде кепти генерациялоочу синтезаторлордун деңгээлине жетпейт, бирок ошого карабастан, натыйжа бир топ окумдуу жана үн күчөткүчтөн трансляциялык жазууга окшош. . Салыштыруу үчүн, машина үйрөнүү технологияларынын негизинде сүйлөө синтези үчүн ачык кыймылдаткычты жана орус тили үчүн моделдердин топтомун камсыз кылган Silero долбоору сапаты боюнча RHVoiceтен ашып кетет.
Орус тили үчүн 14 үн варианты бар, англис тили үчүн - 6. Үндөр табигый кеп жазууларынын негизинде түзүлөт. Жөндөөлөрдөн сиз ылдамдыкты, бийиктикти жана үндү өзгөртө аласыз. Темпти өзгөртүү үчүн Sonic китепканасын колдонсо болот. Киргизилген тексттин анализинин негизинде тилди автоматтык түрдө аныктоо жана которуу мүмкүн (мисалы, башка тилдеги сөздөр жана тырмакчалар үчүн бул тил үчүн нукура синтез модели колдонулушу мүмкүн). Ар кандай тилдер үчүн үндөрдүн айкалышын аныктоочу үн профилдери колдоого алынат.
Source: opennet.ru
