Vydání hlasového syntezátoru RHVoice 1.6.0

Byl vydán systém syntézy řeči RHVoice 1.6.0 s otevřeným zdrojovým kódem. Původně byl vyvinut pro vysoce kvalitní podporu ruštiny, ale od té doby byl adaptován i pro další jazyky, včetně angličtiny, portugalštiny, ukrajinštiny, kyrgyzštiny, tatarštiny a gruzínštiny. Kód je napsán v jazyce C++ a distribuován pod licencí LGPL 2.1. Podpora je také podporována pro GNU/Linux.Linux, Windows и AndroidProgram je kompatibilní s typickými rozhraními TTS (text-to-speech) pro převod textu na řeč: SAPI5 (Windows), Dispečer řeči (GNU/Linux) A Android API pro převod textu na řeč, ale lze jej použít i s čtečkou obrazovky NVDA. Tvůrkyní a hlavní vývojářkou RHVoice je Olga Yakovleva, která projekt nadále vyvíjí i přes svou úplnou slepotu.

Nová verze přidává 5 nových hlasových možností pro ruskou řeč. Byla implementována podpora albánštiny. Ukrajinský slovník byl aktualizován. Byla rozšířena podpora výslovnosti emoji. V aplikaci platformy byly provedeny opravy chyb. Android, import uživatelských slovníků byl zjednodušen a byla přidána podpora platforem Android 11. Do jádra enginu byla přidána nová nastavení a funkce, včetně g2p.case, word_break a podpory pro ekvalizační filtry.

Připomeňme, že RHVoice využívá vývoj projektu HTS (HMM/DNN-based Speech Synthesis System) a parametrickou metodu syntézy se statistickými modely (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Výhodou statistického modelu jsou nízké režijní náklady a nenáročný výkon CPU. Všechny operace se provádějí lokálně v systému uživatele. Podporovány jsou tři úrovně kvality řeči (čím nižší kvalita, tím vyšší výkon a kratší reakční doba).

Nevýhodou statistického modelu je poměrně nízká kvalita výslovnosti, která sice nedosahuje úrovně syntezátorů generujících řeč na základě kombinace fragmentů přirozené řeči, ale přesto je výsledek vcelku čitelný a připomíná vysílání nahrávky z reproduktoru. . Pro srovnání, projekt Silero, který poskytuje otevřený motor pro syntézu řeči založený na technologiích strojového učení a sadu modelů pro ruský jazyk, je kvalitnější než RHVoice.

Pro ruský jazyk je k dispozici 13 hlasových možností a pro angličtinu 5. Hlasy jsou tvořeny na základě nahrávek přirozené řeči. V nastavení můžete změnit rychlost, výšku tónu a hlasitost. Ke změně tempa lze použít knihovnu Sonic. Je možné automaticky detekovat a přepínat jazyky na základě analýzy vstupního textu (například pro slova a uvozovky v jiném jazyce lze použít model syntézy nativní pro tento jazyk). Podporovány jsou hlasové profily, které definují kombinace hlasů pro různé jazyky.

Zdroj: opennet.ru

Kupte si spolehlivý hosting pro stránky s DDoS ochranou, VPS VDS servery 🔥 Kupte si spolehlivý webhosting s ochranou DDoS, VPS VDS servery | ProHoster