RHVoice 1.8.0 kõnesüntesaatori väljalase

Välja anti avatud kõnesünteesisüsteem RHVoice 1.8.0, mis algselt töötati välja vene keele kvaliteetse toe pakkumiseks, kuid kohandati seejärel muudele keeltele, sealhulgas inglise, portugali, ukraina, kirgiisi, tatari ja gruusia keelele. Kood on kirjutatud C++ keeles ja seda levitatakse LGPL 2.1 litsentsi all. Toetab tööd GNU/Linuxis, Windowsis ja Androidis. Programm ühildub standardsete TTS-i (tekst kõneks) liidestega teksti kõneks teisendamiseks: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ja Android Text-To-Speech API, kuid seda saab kasutada ka NVDA-s ekraanilugeja. RHVoice'i looja ja põhiarendaja on Olga Yakovleva, kes arendab projekti vaatamata täiesti pimedale.

Androidi platvormi versioon 1.8 tutvustab uut hääle- ja keeleandmete haldussüsteemi, mis võimaldab ilma mobiilirakendust uuendamata alla laadida kõneandmete värskendusi. Lisatud häälte ja keelte andmete värskendusi kontrollitakse automaatselt. Lisaks tutvustab uus versioon poola keele tuge ja lisab uue hääle makedoonia keelele. Ühilduvus NVDA ekraanilugeja uusimate alfa- ja beetaversioonidega on tagatud. Lahendatud on probleemid Linuxi platvormile ehitamisega, mis ilmnesid siis, kui Speech Dispatcherit ei olnud.

Meenutagem, et RHVoice kasutab HTS-projekti (HMM/DNN-põhine Speech Synthesis System) ja parameetrilise sünteesimeetodi arendusi koos statistiliste mudelitega (Statistical Parametric Synthesis põhineb HMM-il - Hidden Markovi Model). Statistilise mudeli eeliseks on madalad üldkulud ja vähenõudlik protsessori võimsus. Kõik toimingud tehakse kasutaja süsteemis kohapeal. Toetatud on kolm kõnekvaliteedi taset (mida madalam on kvaliteet, seda suurem on jõudlus ja lühem reaktsiooniaeg).

Statistilise mudeli miinuseks on suhteliselt madal häälduskvaliteet, mis ei küündi loomuliku kõne katkendite kombinatsioonil põhinevat kõnet genereerivate süntesaatorite tasemele, kuid sellegipoolest on tulemus üsna loetav ja meenutab valjuhääldist salvestise edastamist. . Võrdluseks – projekt Silero, mis pakub masinõppetehnoloogiatel põhinevat avatud kõnesünteesimootorit ja vene keele mudelite komplekti, on kvaliteedilt parem kui RHVoice.

Vene keele häälevalikuid on 14 ja inglise keele jaoks 6. Hääled moodustatakse loomuliku kõne salvestiste põhjal. Seadistustes saate muuta kiirust, helikõrgust ja helitugevust. Sonicu teeki saab kasutada tempo muutmiseks. Sisestatud teksti analüüsi põhjal on võimalik keeli automaatselt tuvastada ja vahetada (näiteks mõne muu keele sõnade ja tsitaatide puhul saab kasutada selle keele sünteesimudelit). Toetatud on hääleprofiilid, mis määravad erinevate keelte häälte kombinatsioonid.

Allikas: opennet.ru

Lisa kommentaar