Vydaný syntetizátor reči RHVoice 1.8.0

Bol vydaný otvorený systém syntézy reči RHVoice 1.8.0, pôvodne vyvinutý tak, aby poskytoval vysokokvalitnú podporu pre ruský jazyk, ale potom sa prispôsobil pre ďalšie jazyky vrátane angličtiny, portugalčiny, ukrajinčiny, kirgizštiny, tatárčiny a gruzínčiny. Kód je napísaný v C++ a distribuovaný pod licenciou LGPL 2.1. Podporuje prácu na GNU/Linux, Windows a Android. Program je kompatibilný so štandardnými rozhraniami TTS (text-to-speech) na prevod textu na reč: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) a Android Text-To-Speech API, ale dá sa použiť aj v NVDA. čítačka obrazovky. Tvorcom a hlavným vývojárom RHVoice je Olga Yakovleva, ktorá projekt rozvíja napriek tomu, že je úplne slepá.

Verzia 1.8 pre platformu Android predstavuje nový systém správy hlasových a jazykových dát, ktorý umožňuje sťahovať aktualizácie hlasových dát bez aktualizácie mobilnej aplikácie. Aktualizácie údajov pre pridané hlasy a jazyky sa kontrolujú automaticky. Okrem toho nová verzia zavádza podporu pre poľský jazyk a pridáva nový hlas pre macedónsky jazyk. Zaručená je kompatibilita s najnovšími alfa a beta verziami čítačky obrazovky NVDA. Opravené problémy s budovaním na platforme Linux, ktoré sa vyskytli, keď nebol prítomný Speech Dispatcher.

Pripomeňme, že RHVoice využíva vývoj projektu HTS (HMM/DNN-based Speech Synthesis System) a metódu parametrickej syntézy so štatistickými modelmi (Statistical Parametric Synthesis based on HMM – Hidden Markov Model). Výhodou štatistického modelu sú nízke režijné náklady a nenáročný výkon CPU. Všetky operácie sa vykonávajú lokálne v systéme používateľa. Podporované sú tri úrovne kvality reči (čím nižšia kvalita, tým vyšší výkon a kratší reakčný čas).

Negatívom štatistického modelu je pomerne nízka kvalita výslovnosti, ktorá nedosahuje úroveň syntetizátorov generujúcich reč na základe kombinácie fragmentov prirodzenej reči, no napriek tomu je výsledok celkom čitateľný a pripomína vysielanie nahrávky z reproduktora. . Pre porovnanie, projekt Silero, ktorý poskytuje otvorený motor na syntézu reči založený na technológiách strojového učenia a súbor modelov pre ruský jazyk, je kvalitnejší ako RHVoice.

Pre ruský jazyk je k dispozícii 14 hlasových možností a pre anglický jazyk 6. Hlasy sú tvorené na základe nahrávok prirodzenej reči. V nastaveniach môžete zmeniť rýchlosť, výšku tónu a hlasitosť. Na zmenu tempa je možné použiť knižnicu Sonic. Je možné automaticky zisťovať a prepínať jazyky na základe analýzy vstupného textu (napríklad pre slová a úvodzovky v inom jazyku možno použiť model syntézy natívny pre tento jazyk). Podporované sú hlasové profily, ktoré definujú kombinácie hlasov pre rôzne jazyky.

Zdroj: opennet.ru

Pridať komentár