Lanzouse RHVoice 1.6.0, un sistema de síntese de voz de código aberto. Desenvolvido inicialmente para proporcionar soporte de alta calidade para o ruso, foi adaptado posteriormente para outras linguas, incluíndo inglés, portugués, ucraíno, kirguís, tártaro e xeorxiano. O código está escrito en C++ e distribúese baixo a licenza LGPL 2.1. Tamén se admite soporte para GNU/Linux.Linux, Windows и AndroidO programa é compatible coas interfaces TTS (texto a voz) típicas para converter texto a voz: SAPI5 (Windows), Despachador de voz (GNU/Linux) E Android API de texto a voz, pero tamén se pode usar co lector de pantalla NVDA. A creadora e principal desenvolvedora de RHVoice é Olga Yakovleva, que continúa a desenvolver o proxecto a pesar de ser completamente cega.
A nova versión engade 5 novas opcións de voz para a fala rusa. Implementouse a compatibilidade co idioma albanés. Actualizouse o dicionario ucraíno. Ampliouse a compatibilidade coa pronuncia de emojis. Implementáronse correccións de erros na aplicación da plataforma. Android, simplificouse a importación de dicionarios de usuario e engadiuse compatibilidade coa plataforma Android 11. Engadíronse novas configuracións e funcionalidades ao núcleo do motor, como g2p.case, word_break e compatibilidade con filtros de ecualización.
Lembremos que RHVoice utiliza os desenvolvementos do proxecto HTS (Sistema de síntese da fala baseado en HMM/DNN) e o método de síntese paramétrica con modelos estatísticos (Sintesis paramétrica estatística baseada en HMM - Hidden Markov Model). A vantaxe do modelo estatístico son os baixos custos xerais e a pouca potencia da CPU. Todas as operacións realízanse localmente no sistema do usuario. Admítense tres niveis de calidade da voz (canto menor sexa a calidade, maior será o rendemento e menor será o tempo de reacción).
A desvantaxe do modelo estatístico é a relativamente baixa calidade da pronuncia, que non alcanza o nivel de sintetizadores que xeran fala a partir dunha combinación de fragmentos de fala natural, pero con todo o resultado é bastante lexible e aseméllase á emisión dunha gravación desde un altofalante. . A modo de comparación, o proxecto Silero, que proporciona un motor de síntese de voz aberto baseado en tecnoloxías de aprendizaxe automática e un conxunto de modelos para a lingua rusa, é superior en calidade a RHVoice.
Hai 13 opcións de voz dispoñibles para o idioma ruso e 5 para o inglés. As voces fórmanse a partir de gravacións de fala natural. Na configuración pode cambiar a velocidade, o ton e o volume. A biblioteca de Sonic pódese usar para cambiar o tempo. É posible detectar e cambiar de idioma automaticamente en función da análise do texto introducido (por exemplo, para palabras e citas noutro idioma, pódese utilizar un modelo de síntese nativo dese idioma). Admítense os perfís de voz, que definen combinacións de voces para diferentes idiomas.
Fonte: opennet.ru
