Utgivelse av talesynthesizer RHVoice 1.2.4, utviklet for det russiske språket

Utgivelsen av det åpne talesyntesesystemet RHVoice 1.2.4 har blitt publisert, opprinnelig utviklet for å gi høykvalitetsstøtte for det russiske språket, men deretter tilpasset for andre språk, inkludert engelsk, portugisisk, ukrainsk, kirgisisk, tatarisk og georgisk. Koden er skrevet i C++ og distribuert under LGPL 2.1-lisensen. Støtter arbeid på GNU/Linux, Windows og Android. Programmet er kompatibelt med standard TTS-grensesnitt (tekst-til-tale) for konvertering av tekst til tale: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) og Android Text-To-Speech API, men kan også brukes i NVDA skjermleser.

Programmet bruker den parametriske syntesemetoden med statistiske modeller (Statistical Parametric Synthesis basert på HMM - Hidden Markov Model). Fordelen med den statistiske modellen er lave overheadkostnader og lite krevende CPU-kraft. Alle operasjoner utføres lokalt på brukerens system. Tre nivåer av talekvalitet støttes (jo lavere kvalitet, jo høyere ytelse og kortere reaksjonstid).

Støtter innstilling og endring av stemmer. Det er 9 stemmealternativer tilgjengelig for det russiske språket, og 5 for engelsk Stemmene er dannet basert på opptak av naturlig tale. På grunn av bruken av en statistisk modell når ikke uttalekvaliteten nivået til synthesizere som genererer tale basert på en kombinasjon av fragmenter av naturlig tale, men likevel er resultatet ganske forståelig og ligner en sending av et opptak fra en høyttaler .

I innstillingene kan du endre hastighet, tonehøyde og volum. Sonic-biblioteket kan brukes til å endre tempo. Det er mulig å automatisk oppdage og bytte språk basert på analyse av inndatateksten (for eksempel, for ord og sitater på et annet språk, kan en syntesemodell som er hjemmehørende i det språket brukes). Stemmeprofiler støttes, og definerer kombinasjoner av stemmer for forskjellige språk.

Kilde: opennet.ru

Legg til en kommentar