RHVoice 1.8.0 кеп синтезаторунун чыгарылышы

RHVoice 1.8.0, ачык булактуу кеп синтези системасы жарыкка чыкты, адегенде орус тилин сапаттуу колдоо үчүн иштелип чыккан, бирок кийин башка тилдерге, анын ичинде англис, португал, украин, кыргыз, татар жана грузин тилдерине ылайыкташтырылган. Код C++ тилинде жазылган жана LGPL 2.1 лицензиясы боюнча таратылган. Жумуш GNU/Linux, Windows жана Androidде колдоого алынат. Программа тексттен сөзгө типтүү TTS (тексттен сөзгө) интерфейстери менен шайкеш келет: SAPI5 (Windows), Кеп диспетчери (GNU/Linux) жана Android Text-to-Speech API, бирок ошондой эле NVDA экранды окугуч. RHVoice'тун жаратуучусу жана негизги иштеп чыгуучусу Ольга Яковлева, ал толугу менен сокур болгонуна карабай долбоорду иштеп чыгат.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Эске салсак, RHVoice HTS долбоорунун иштеп чыгууларын (HMM/DNN негизиндеги Speech Synthesis System) жана статистикалык моделдер менен параметрдик синтез ыкмасын (HMM негизиндеги статистикалык параметрлик синтез – Жашыруун Марков модели) колдонот. Статистикалык моделдин артыкчылыгы аз ашыкча чыгым жана талап кылынбаган CPU кубаттуулугу. Бардык операциялар колдонуучунун системасында локалдуу түрдө аткарылат. Кептин сапатынын үч деңгээли колдоого алынат (канчалык сапаты төмөн болсо, аткаруу ошончолук жогору жана жооп берүү убактысы ошончолук кыскарат).

Статистикалык моделдин кемчилиги - айтылышынын салыштырмалуу төмөн сапаты, ал табигый кептин фрагменттеринин айкалышынын негизинде кепти генерациялоочу синтезаторлордун деңгээлине жетпейт, бирок ошого карабастан, натыйжа бир топ окумдуу жана үн күчөткүчтөн трансляциялык жазууга окшош. . Салыштыруу үчүн, машина үйрөнүү технологияларынын негизинде сүйлөө синтези үчүн ачык кыймылдаткычты жана орус тили үчүн моделдердин топтомун камсыз кылган Silero долбоору сапаты боюнча RHVoiceтен ашып кетет.

Орус тили үчүн 14 үн варианты бар, англис тили үчүн - 6. Үндөр табигый кеп жазууларынын негизинде түзүлөт. Жөндөөлөрдөн сиз ылдамдыкты, бийиктикти жана үндү өзгөртө аласыз. Темпти өзгөртүү үчүн Sonic китепканасын колдонсо болот. Киргизилген тексттин анализинин негизинде тилди автоматтык түрдө аныктоо жана которуу мүмкүн (мисалы, башка тилдеги сөздөр жана тырмакчалар үчүн бул тил үчүн нукура синтез модели колдонулушу мүмкүн). Ар кандай тилдер үчүн үндөрдүн айкалышын аныктоочу үн профилдери колдоого алынат.

Source: opennet.ru

Комментарий кошуу