Выпуск сінтэзатара прамовы RHVoice 1.2.4, які развіваецца для рускай мовы

Апублікаваны выпуск адкрытай сістэмы сінтэзу маўлення RHVoice 1.2.4, якая першапачаткова развівалася для забеспячэння якаснай падтрымкі рускай мовы, але затым адаптаванай і для іншых моў, уключаючы англійскую, партугальскую, украінскую, кіргізскую, татарскую і грузінскую. Код напісаны на З і распаўсюджваецца пад ліцэнзіяй LGPL 2.1. Падтрымліваецца праца ў GNU/Linux, Windows і Android. Праграма сумяшчальная з тыпавымі TTS-інтэрфейсамі (text-to-speech) для пераўтварэння тэксту ў гаворку: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) і Android Text-To-Speech API, але таксама можа выкарыстоўвацца ў экранным рыдэры NVDA.

У праграме прымяняецца параметрычны метад сінтэзу са статыстычнымі мадэлямі (Statistical Parametric Synthesis на базе HMM – Hidden Markov Model). Плюсам статыстычнай мадэлі з'яўляюцца нізкія накладныя выдаткі і непатрабавальнасць да магутнасці CPU. Усе аперацыі выконваюцца лакальна на сістэме карыстальніка. Падтрымліваецца тры ўзроўню якасці гаворкі (чым ніжэй якасць - тым вышэй прадукцыйнасць і менш час рэакцыі).

Падтрымліваецца настройка і змена галасоў. Для рускай мовы даступна 9 варыянтаў галасоў, для англійскай - 5. Галасы фарміруюцца на аснове запісаў натуральнай гаворкі. З-за выкарыстанні статыстычнай мадэлі якасць вымаўлення не дасягае ўзроўня сінтэзатараў, якія генеруюць гаворка на аснове камбінацыі фрагментаў натуральнай гаворкі, але тым не менш вынік суцэль пераборлівы і нагадвае трансляцыю запісу з гучнагаварыцеля.

У наладах можна змяняць хуткасць, вышыню і гучнасць. Для змены тэмпу можа прымяняцца бібліятэка Sonic. Магчыма аўтаматычнае вызначэнне і пераключэнне мовы на аснове аналізу ўваходнага тэксту (напрыклад, для слоў і цытат на іншай мове можа выкарыстоўвацца родная для дадзенай мовы мадэль сінтэзу). Падтрымліваюцца галасавыя профілі, якія вызначаюць спалучэнне галасоў для розных моў.

Крыніца: opennet.ru

Дадаць каментар