Објављен синтисајзер говора РХВоице 1.8.0

Објављен је систем за синтезу отвореног говора РХВоице 1.8.0, првобитно развијен да пружи висококвалитетну подршку за руски језик, али је потом прилагођен за друге језике, укључујући енглески, португалски, украјински, киргиски, татарски и грузијски. Код је написан у Ц++ и дистрибуира се под лиценцом ЛГПЛ 2.1. Подржава рад на ГНУ/Линук, Виндовс и Андроид. Програм је компатибилан са стандардним ТТС (тект-то-спеецх) интерфејсима за претварање текста у говор: САПИ5 (Виндовс), Спеецх Диспатцхер (ГНУ/Линук) и Андроид Тект-То-Спеецх АПИ, али се такође може користити у НВДА читач екрана. Креатор и главни програмер РХВоице-а је Олга Јаковлева, која развија пројекат иако је потпуно слепа.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Подсетимо, РХВоице користи развој ХТС пројекта (ХММ/ДНН-басед Спеецх Синтхесис Систем) и метод параметарске синтезе са статистичким моделима (Статистицал Параметриц Синтхесис басед он ХММ – Хидден Марков Модел). Предност статистичког модела су ниски режијски трошкови и незахтевна снага процесора. Све операције се обављају локално на систему корисника. Подржана су три нивоа квалитета говора (што је нижи квалитет, то је боље перформансе и краће време реакције).

Недостатак статистичког модела је релативно низак квалитет изговора, који не достиже ниво синтисајзера који генеришу говор на основу комбинације фрагмената природног говора, али је ипак резултат прилично читљив и подсећа на емитовање снимка са звучника. . Поређења ради, пројекат Силеро, који обезбеђује мотор за синтезу отвореног говора заснован на технологијама машинског учења и скуп модела за руски језик, супериорнији је по квалитету у односу на РХВоице.

За руски језик је доступно 14 гласовних опција, а за енглески 6. Гласови се формирају на основу снимака природног говора. У подешавањима можете променити брзину, висину и јачину звука. Сониц библиотека се може користити за промену темпа. Могуће је аутоматски открити и променити језике на основу анализе улазног текста (на пример, за речи и цитате на другом језику, може се користити модел синтезе који је матерњи за тај језик). Подржани су гласовни профили који дефинишу комбинације гласова за различите језике.

Извор: опеннет.ру

Додај коментар