Sortie du synthétiseur vocal RHVoice 1.2.4, développé pour la langue russe

La version du système ouvert de synthèse vocale RHVoice 1.2.4 a été publiée, initialement développée pour fournir un support de haute qualité pour la langue russe, mais ensuite adaptée à d'autres langues, notamment l'anglais, le portugais, l'ukrainien, le kirghize, le tatar et le géorgien. Le code est écrit en C++ et distribué sous licence LGPL 2.1. Prend en charge le travail sur GNU/Linux, Windows et Android. Le programme est compatible avec les interfaces TTS (text-to-speech) standard pour convertir du texte en parole : SAPI5 (Windows), Speech Dispatcher (GNU/Linux) et Android Text-To-Speech API, mais peut également être utilisé dans NVDA. Lecteur d'écran.

Le programme utilise la méthode de synthèse paramétrique avec des modèles statistiques (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). L'avantage du modèle statistique réside dans de faibles frais généraux et une puissance CPU peu exigeante. Toutes les opérations sont effectuées localement sur le système de l'utilisateur. Trois niveaux de qualité vocale sont pris en charge (plus la qualité est faible, plus les performances sont élevées et plus le temps de réaction est court).

Prend en charge le réglage et le changement de voix. Il existe 9 options vocales disponibles pour la langue russe et 5 pour l'anglais. Les voix sont formées sur la base d'enregistrements de parole naturelle. Grâce à l'utilisation d'un modèle statistique, la qualité de la prononciation n'atteint pas le niveau des synthétiseurs qui génèrent de la parole à partir d'une combinaison de fragments de parole naturelle, mais le résultat est néanmoins tout à fait intelligible et ressemble à la diffusion d'un enregistrement depuis un haut-parleur. .

Dans les paramètres, vous pouvez modifier la vitesse, la hauteur et le volume. La bibliothèque Sonic peut être utilisée pour modifier le tempo. Il est possible de détecter et de changer automatiquement de langue en fonction de l'analyse du texte saisi (par exemple, pour les mots et les citations dans une autre langue, un modèle de synthèse natif de cette langue peut être utilisé). Les profils vocaux sont pris en charge, définissant des combinaisons de voix pour différentes langues.

Source: opennet.ru

Ajouter un commentaire