Vrystelling van spraaksintetiseerder RHVoice 1.2.4, ontwikkel vir die Russiese taal

Die vrystelling van die oopspraaksintesestelsel RHVoice 1.2.4 is gepubliseer, aanvanklik ontwikkel om hoëgehalte-ondersteuning vir die Russiese taal te bied, maar toe aangepas vir ander tale, insluitend Engels, Portugees, Oekraïens, Kirgisies, Tataars en Georgies. Die kode is in C++ geskryf en onder die LGPL 2.1-lisensie versprei. Ondersteun werk op GNU/Linux, Windows en Android. Die program is versoenbaar met standaard TTS (teks-na-spraak)-koppelvlakke vir die omskakeling van teks na spraak: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) en Android Text-to-Speech API, maar kan ook in die NVDA gebruik word skermleser.

Die program gebruik die parametriese sintesemetode met statistiese modelle (Statistical Parametric Synthesis gebaseer op HMM - Hidden Markov Model). Die voordeel van die statistiese model is lae oorhoofse koste en veeleisende SVE-krag. Alle bewerkings word plaaslik op die gebruiker se stelsel uitgevoer. Drie vlakke van spraakkwaliteit word ondersteun (hoe laer die kwaliteit, hoe hoër die werkverrigting en hoe korter die reaksietyd).

Ondersteun die instelling en verandering van stemme. Daar is 9 stemopsies beskikbaar vir die Russiese taal, en 5 vir Engels.Die stemme word gevorm op grond van opnames van natuurlike spraak. As gevolg van die gebruik van 'n statistiese model, bereik die kwaliteit van uitspraak nie die vlak van sintetiseerders wat spraak genereer gebaseer op 'n kombinasie van fragmente van natuurlike spraak nie, maar nietemin is die resultaat redelik verstaanbaar en lyk soos 'n uitsending van 'n opname vanaf 'n luidspreker .

In die instellings kan jy die spoed, toonhoogte en volume verander. Die Sonic-biblioteek kan gebruik word om die tempo te verander. Dit is moontlik om outomaties op te spoor en tale te verander op grond van die ontleding van die invoerteks (byvoorbeeld, vir woorde en aanhalings in 'n ander taal, kan 'n sintesemodel inheems aan daardie taal gebruik word). Stemprofiele word ondersteun, wat kombinasies van stemme vir verskillende tale definieer.

Bron: opennet.ru

Voeg 'n opmerking