Išleistas kalbos sintezatorius RHVoice 1.2.4, sukurtas rusų kalbai

Paskelbtas atviros kalbos sintezės sistemos RHVoice 1.2.4 leidimas, iš pradžių sukurtas siekiant teikti aukštos kokybės rusų kalbos palaikymą, bet vėliau pritaikytas kitoms kalboms, įskaitant anglų, portugalų, ukrainiečių, kirgizų, totorių ir gruzinų kalbas. Kodas parašytas C++ kalba ir platinamas pagal LGPL 2.1 licenciją. Palaiko darbą GNU/Linux, Windows ir Android. Programa suderinama su standartinėmis TTS (teksto į kalbą) sąsajomis, skirtomis tekstui konvertuoti į kalbą: SAPI5 („Windows“, „Speech Dispatcher“ (GNU/Linux) ir „Android Text-To-Speech“ API), tačiau gali būti naudojama ir NVDA. ekrano skaitytuvas.

Programoje naudojamas parametrinės sintezės metodas su statistiniais modeliais (Statistical Parametric Synthesis remiantis HMM – Hidden Markov Model). Statistinio modelio pranašumas yra mažos pridėtinės išlaidos ir nereiklus procesoriaus galia. Visos operacijos atliekamos lokaliai vartotojo sistemoje. Palaikomi trys kalbos kokybės lygiai (kuo žemesnė kokybė, tuo didesnis našumas ir trumpesnis reakcijos laikas).

Palaiko balsų nustatymą ir keitimą. Rusų kalbai yra 9 balso parinktys, anglų – 5. Balsai formuojami remiantis natūralios kalbos įrašais. Dėl statistinio modelio naudojimo tarimo kokybė nepasiekia sintezatorių, kurie generuoja kalbą pagal natūralios kalbos fragmentų derinį, lygio, tačiau rezultatas yra gana suprantamas ir primena įrašo transliaciją iš garsiakalbio. .

Nustatymuose galite keisti greitį, aukštį ir garsumą. Sonic biblioteka gali būti naudojama norint pakeisti tempą. Galima automatiškai aptikti ir perjungti kalbas, remiantis įvesties teksto analize (pavyzdžiui, žodžiams ir citatoms kita kalba gali būti naudojamas tai kalbai būdingas sintezės modelis). Palaikomi balso profiliai, apibrėžiantys skirtingų kalbų balsų derinius.

Šaltinis: opennet.ru

Добавить комментарий