Rilascio del sintetizzatore vocale RHVoice 1.2.4, sviluppato per la lingua russa

È stato pubblicato il rilascio del sistema aperto di sintesi vocale RHVoice 1.2.4, inizialmente sviluppato per fornire un supporto di alta qualità per la lingua russa, ma poi adattato per altre lingue, tra cui inglese, portoghese, ucraino, kirghiso, tataro e georgiano. Il codice è scritto in C++ e distribuito sotto la licenza LGPL 2.1. Supporta il lavoro su GNU/Linux, Windows e Android. Il programma è compatibile con le interfacce TTS (sintesi vocale) standard per la conversione del testo in voce: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) e Android Text-To-Speech API, ma può essere utilizzato anche in NVDA lettore di schermo.

Il programma utilizza il metodo di sintesi parametrica con modelli statistici (Sintesi Parametrica Statistica basata su HMM - Hidden Markov Model). Il vantaggio del modello statistico sono i bassi costi generali e la scarsa potenza della CPU. Tutte le operazioni vengono eseguite localmente sul sistema dell'utente. Sono supportati tre livelli di qualità vocale (minore è la qualità, maggiore è la prestazione e minore è il tempo di reazione).

Supporta l'impostazione e la modifica delle voci. Per la lingua russa sono disponibili 9 opzioni vocali e per l'inglese 5. Le voci vengono formate sulla base delle registrazioni del parlato naturale. A causa dell'utilizzo di un modello statistico, la qualità della pronuncia non raggiunge il livello dei sintetizzatori che generano il parlato sulla base di una combinazione di frammenti del discorso naturale, ma il risultato è comunque abbastanza comprensibile e ricorda la trasmissione di una registrazione da un altoparlante .

Nelle impostazioni è possibile modificare la velocità, il tono e il volume. La libreria Sonic può essere utilizzata per modificare il tempo. È possibile rilevare e cambiare lingua automaticamente in base all'analisi del testo di input (ad esempio, per parole e citazioni in un'altra lingua, è possibile utilizzare un modello di sintesi nativo di quella lingua). Sono supportati i profili vocali, che definiscono combinazioni di voci per lingue diverse.

Fonte: opennet.ru

Aggiungi un commento