Vydání syntezátoru řeči RHVoice 1.2.4, vyvinutého pro ruský jazyk

Bylo zveřejněno vydání otevřeného systému syntézy řeči RHVoice 1.2.4, původně vyvinutého pro poskytování vysoce kvalitní podpory ruského jazyka, ale poté přizpůsobeného pro další jazyky, včetně angličtiny, portugalštiny, ukrajinštiny, kyrgyzštiny, tatarštiny a gruzínštiny. Kód je napsán v C++ a distribuován pod licencí LGPL 2.1. Podporuje práci na GNU/Linux, Windows a Android. Program je kompatibilní se standardními rozhraními TTS (text-to-speech) pro převod textu na řeč: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) a Android Text-To-Speech API, ale lze jej použít i v NVDA. čtečka obrazovky.

Program využívá metodu parametrické syntézy se statistickými modely (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Výhodou statistického modelu jsou nízké režijní náklady a nenáročný výkon CPU. Všechny operace se provádějí lokálně v systému uživatele. Podporovány jsou tři úrovně kvality řeči (čím nižší kvalita, tím vyšší výkon a kratší reakční doba).

Podporuje nastavení a změnu hlasů. Pro ruský jazyk je k dispozici 9 hlasových možností a pro angličtinu 5. Hlasy jsou tvořeny na základě nahrávek přirozené řeči. Kvalita výslovnosti nedosahuje díky použití statistického modelu úrovně syntezátorů, které generují řeč na základě kombinace fragmentů přirozené řeči, ale přesto je výsledek vcelku srozumitelný a připomíná vysílání nahrávky z reproduktoru. .

V nastavení můžete změnit rychlost, výšku tónu a hlasitost. Ke změně tempa lze použít knihovnu Sonic. Je možné automaticky detekovat a přepínat jazyky na základě analýzy vstupního textu (například pro slova a uvozovky v jiném jazyce lze použít model syntézy nativní pro tento jazyk). Podporovány jsou hlasové profily, které definují kombinace hlasů pro různé jazyky.

Zdroj: opennet.ru

Přidat komentář