RHVoice 1.6.0 kõnesüntesaatori väljalase

Välja anti avatud kõnesünteesisüsteem RHVoice 1.6.0, mis algselt töötati välja vene keele kvaliteetse toe pakkumiseks, kuid kohandati seejärel muudele keeltele, sealhulgas inglise, portugali, ukraina, kirgiisi, tatari ja gruusia keelele. Kood on kirjutatud C++ keeles ja seda levitatakse LGPL 2.1 litsentsi all. Toetab tööd GNU/Linuxis, Windowsis ja Androidis. Programm ühildub standardsete TTS-i (tekst kõneks) liidestega teksti kõneks teisendamiseks: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ja Android Text-To-Speech API, kuid seda saab kasutada ka NVDA-s ekraanilugeja. RHVoice'i looja ja põhiarendaja on Olga Yakovleva, kes arendab projekti vaatamata täiesti pimedale.

Uus versioon lisab vene kõne jaoks 5 uut häälevalikut. Albaania keele tugi on rakendatud. Ukraina keele sõnastikku on uuendatud. Laiendatud on emotikonitegelaste häälnäitlemise tuge. Tööd on tehtud Androidi platvormi rakenduse vigade kõrvaldamiseks, lihtsustatud on kohandatud sõnastike importi ning lisatud on tugi platvormile Android 11. Mootori tuumale on lisatud uued seaded ja funktsionaalsus, sh g2p. case, word_break ja võrdsusfiltrite tugi.

Meenutagem, et RHVoice kasutab HTS-projekti (HMM/DNN-põhine Speech Synthesis System) ja parameetrilise sünteesimeetodi arendusi koos statistiliste mudelitega (Statistical Parametric Synthesis põhineb HMM-il - Hidden Markovi Model). Statistilise mudeli eeliseks on madalad üldkulud ja vähenõudlik protsessori võimsus. Kõik toimingud tehakse kasutaja süsteemis kohapeal. Toetatud on kolm kõnekvaliteedi taset (mida madalam on kvaliteet, seda suurem on jõudlus ja lühem reaktsiooniaeg).

Statistilise mudeli miinuseks on suhteliselt madal häälduskvaliteet, mis ei küündi loomuliku kõne katkendite kombinatsioonil põhinevat kõnet genereerivate süntesaatorite tasemele, kuid sellegipoolest on tulemus üsna loetav ja meenutab valjuhääldist salvestise edastamist. . Võrdluseks – projekt Silero, mis pakub masinõppetehnoloogiatel põhinevat avatud kõnesünteesimootorit ja vene keele mudelite komplekti, on kvaliteedilt parem kui RHVoice.

Vene keele häälevalikuid on 13 ja inglise keele jaoks 5. Hääled moodustatakse loomuliku kõne salvestiste põhjal. Seadistustes saate muuta kiirust, helikõrgust ja helitugevust. Sonicu teeki saab kasutada tempo muutmiseks. Sisestatud teksti analüüsi põhjal on võimalik keeli automaatselt tuvastada ja vahetada (näiteks mõne muu keele sõnade ja tsitaatide puhul saab kasutada selle keele sünteesimudelit). Toetatud on hääleprofiilid, mis määravad erinevate keelte häälte kombinatsioonid.

Allikas: opennet.ru

Lisa kommentaar