Llançament del sintetitzador de veu RHVoice 1.2.4, desenvolupat per a l'idioma rus

S'ha publicat el llançament del sistema de síntesi de veu obert RHVoice 1.2.4, desenvolupat inicialment per oferir suport d'alta qualitat per a l'idioma rus, però després adaptat per a altres idiomes, com ara anglès, portuguès, ucraïnès, kirguiz, tàrtar i georgià. El codi està escrit en C++ i distribuït sota la llicència LGPL 2.1. Admet el treball en GNU/Linux, Windows i Android. El programa és compatible amb les interfícies estàndard TTS (text-to-speech) per convertir text a veu: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-to-Speech API, però també es pot utilitzar a NVDA lector de pantalla.

El programa utilitza el mètode de síntesi paramètrica amb models estadístics (Statistical Parametric Synthesis basat en HMM - Hidden Markov Model). L'avantatge del model estadístic són els baixos costos generals i la potència de la CPU poc exigent. Totes les operacions es realitzen localment al sistema de l'usuari. S'admeten tres nivells de qualitat de la parla (com més baixa és la qualitat, més alt és el rendiment i més curt és el temps de reacció).

Admet la configuració i el canvi de veus. Hi ha 9 opcions de veu disponibles per a l'idioma rus i 5 per a l'anglès. Les veus es formen a partir d'enregistraments de parla natural. A causa de l'ús d'un model estadístic, la qualitat de la pronunciació no arriba al nivell de sintetitzadors que generen parla a partir d'una combinació de fragments de parla natural, però tanmateix el resultat és força intel·ligible i s'assembla a una emissió d'un enregistrament des d'un altaveu. .

A la configuració podeu canviar la velocitat, el to i el volum. La biblioteca de Sonic es pot utilitzar per canviar el tempo. És possible detectar i canviar d'idioma automàticament basant-se en l'anàlisi del text d'entrada (per exemple, per a paraules i cometes en un altre idioma, es pot utilitzar un model de síntesi propi d'aquest idioma). S'admeten perfils de veu, que defineixen combinacions de veus per a diferents idiomes.

Font: opennet.ru

Afegeix comentari