Izdaja sintetizatorja govora RHVoice 1.6.0

Izdan je bil RHVoice 1.6.0, odprtokodni sistem za sintezo govora. Prvotno razvit za zagotavljanje visokokakovostne podpore za ruščino, je bil od takrat prilagojen tudi za druge jezike, vključno z angleščino, portugalščino, ukrajinščino, kirgiščino, tatarščino in gruzijščino. Koda je napisana v jeziku C++ in distribuirana pod licenco LGPL 2.1. Podprta je tudi podpora za GNU/Linux.Linux, Windows и AndroidProgram je združljiv s tipičnimi vmesniki TTS (pretvorba besedila v govor) za pretvorbo besedila v govor: SAPI5 (Windows), Razporejevalnik govora (GNU/Linux) In Android API za pretvorbo besedila v govor, lahko pa se uporablja tudi z bralnikom zaslona NVDA. Ustvarjalka in glavna razvijalka RHVoice je Olga Yakovleva, ki kljub popolni slepoti še naprej razvija projekt.

Nova različica dodaja 5 novih glasovnih možnosti za ruski govor. Uvedena je bila podpora za albanščino. Posodobljen je bil ukrajinski slovar. Razširjena je bila podpora za izgovorjavo emojijev. V aplikaciji platforme so bili uvedeni popravki napak. Android, uvoz uporabniških slovarjev je bil poenostavljen in dodana je bila podpora za platformo Android 11. Jedru mehanizma so bile dodane nove nastavitve in funkcionalnosti, vključno z g2p.case, word_break in podporo za izenačevalne filtre.

Naj spomnimo, da RHVoice uporablja razvoj projekta HTS (HMM/DNN-based Speech Synthesis System) in metodo parametrične sinteze s statističnimi modeli (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Prednost statističnega modela so nizki režijski stroški in nezahtevna procesorska moč. Vse operacije se izvajajo lokalno v uporabnikovem sistemu. Podprte so tri stopnje kakovosti govora (nižja kot je kakovost, višja je zmogljivost in krajši reakcijski čas).

Slaba stran statističnega modela je relativno nizka kakovost izgovorjave, ki ne dosega ravni sintetizatorjev, ki generirajo govor na podlagi kombinacije fragmentov naravnega govora, kljub temu pa je rezultat precej berljiv in spominja na predvajanje posnetka iz zvočnika. . Za primerjavo, projekt Silero, ki zagotavlja odprt motor za sintezo govora, ki temelji na tehnologijah strojnega učenja in naboru modelov za ruski jezik, je po kakovosti boljši od RHVoice.

Za ruski jezik je na voljo 13 glasovnih možnosti, za angleški pa 5. Glasovi so oblikovani na podlagi posnetkov naravnega govora. V nastavitvah lahko spremenite hitrost, višino in glasnost. Knjižnico Sonic lahko uporabite za spreminjanje tempa. Možno je samodejno zaznavanje in preklapljanje med jeziki na podlagi analize vnesenega besedila (na primer za besede in citate v drugem jeziku je mogoče uporabiti sintezni model, ki je izviren iz tega jezika). Podprti so glasovni profili, ki določajo kombinacije glasov za različne jezike.

Vir: opennet.ru

Kupite zanesljivo gostovanje za strani z DDoS zaščito, VPS VDS strežniki 🔥 Kupite zanesljivo spletno gostovanje z zaščito DDoS, VPS VDS strežniki | ProHoster