Eldono de parolsintezilo RHVoice 1.2.4, evoluigita por la rusa lingvo

La eldono de la malferma parolsinteza sistemo RHVoice 1.2.4 estis publikigita, komence evoluigita por provizi altkvalitan subtenon por la rusa lingvo, sed poste adaptita por aliaj lingvoj, inkluzive de la angla, portugala, ukraina, kirgiza, tatara kaj kartvela. La kodo estas skribita en C++ kaj distribuita sub la LGPL 2.1 permesilo. Subtenas laboron sur GNU/Linukso, Vindozo kaj Android. La programo kongruas kun normaj TTS (teksto-al-parola) interfacoj por konverti tekston al parolado: SAPI5 (Vindozo), Speech Dispatcher (GNU/Linukso) kaj Android Text-To-Speech API, sed ankaŭ povas esti uzata en la NVDA ekranlegilo.

La programo uzas la parametran sintezmetodon kun statistikaj modeloj (Statistical Parametric Synthesis bazita sur HMM - Hidden Markov Model). La avantaĝo de la statistika modelo estas malaltaj superkostoj kaj nepostulema CPU-potenco. Ĉiuj operacioj estas faritaj loke sur la sistemo de la uzanto. Tri niveloj de parolkvalito estas subtenataj (ju pli malalta la kvalito, des pli alta la rendimento kaj des pli mallonga la reagtempo).

Subtenas agordi kaj ŝanĝi voĉojn. Estas 9 voĉebloj disponeblaj por la rusa lingvo, kaj por la angla 5. La voĉoj estas formitaj surbaze de registradoj de natura parolado. Pro la uzo de statistika modelo, la kvalito de prononco ne atingas la nivelon de sinteziloj, kiuj generas parolon surbaze de kombinaĵo de fragmentoj de natura parolo, sed tamen la rezulto estas sufiĉe komprenebla kaj similas al elsendo de registrado el laŭtparolilo. .

En la agordoj vi povas ŝanĝi la rapidecon, tonalton kaj volumon. La Sonic-biblioteko povas esti uzata por ŝanĝi la takton. Eblas aŭtomate detekti kaj ŝanĝi lingvojn surbaze de analizo de la eniga teksto (ekzemple, por vortoj kaj citaĵoj en alia lingvo, sinteza modelo denaska de tiu lingvo povas esti uzata). Voĉaj profiloj estas subtenataj, difinante kombinaĵojn de voĉoj por malsamaj lingvoj.

fonto: opennet.ru

Aldoni komenton