Lansarea sintetizatorului de vorbire RHVoice 1.2.4, dezvoltat pentru limba rusă

A fost publicată lansarea sistemului deschis de sinteză a vorbirii RHVoice 1.2.4, dezvoltat inițial pentru a oferi suport de înaltă calitate pentru limba rusă, dar apoi adaptat pentru alte limbi, inclusiv engleză, portugheză, ucraineană, kârgâză, tătară și georgiană. Codul este scris în C++ și distribuit sub licența LGPL 2.1. Acceptă lucrul pe GNU/Linux, Windows și Android. Programul este compatibil cu interfețele standard TTS (text-to-speech) pentru conversia textului în vorbire: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) și Android Text-To-Speech API, dar poate fi folosit și în NVDA cititor de ecran.

Programul folosește metoda de sinteză parametrică cu modele statistice (Statistical Parametric Synthesis bazat pe HMM - Hidden Markov Model). Avantajul modelului statistic este costurile generale reduse și puterea CPU nepretențioasă. Toate operațiunile sunt efectuate local pe sistemul utilizatorului. Sunt acceptate trei niveluri de calitate a vorbirii (cu cât calitatea este mai scăzută, cu atât performanța este mai mare și timpul de reacție este mai scurt).

Acceptă setarea și schimbarea vocilor. Există 9 opțiuni de voce disponibile pentru limba rusă și 5 pentru engleză. Vocile sunt formate pe baza înregistrărilor de vorbire naturală. Datorită utilizării unui model statistic, calitatea pronunției nu ajunge la nivelul sintetizatoarelor care generează vorbire pe baza unei combinații de fragmente de vorbire naturală, dar cu toate acestea rezultatul este destul de inteligibil și seamănă cu o difuzare a unei înregistrări dintr-un difuzor. .

În setări puteți modifica viteza, înălțimea și volumul. Biblioteca Sonic poate fi folosită pentru a schimba tempo-ul. Este posibilă detectarea și schimbarea automată a limbilor pe baza analizei textului introdus (de exemplu, pentru cuvinte și citate într-o altă limbă, se poate folosi un model de sinteză nativ în limba respectivă). Profilurile vocale sunt acceptate, definind combinații de voci pentru diferite limbi.

Sursa: opennet.ru

Adauga un comentariu