Bol vydaný systém syntézy reči RHVoice 1.6.0 s otvoreným zdrojovým kódom. Pôvodne bol vyvinutý s cieľom poskytovať vysokokvalitnú podporu pre ruštinu, no odvtedy bol adaptovaný aj pre ďalšie jazyky vrátane angličtiny, portugalčiny, ukrajinčiny, kirgizčiny, tatárčiny a gruzínčiny. Kód je napísaný v jazyku C++ a distribuovaný pod licenciou LGPL 2.1. Podporovaná je aj podpora pre GNU/Linux.Linux, Windows и AndroidProgram je kompatibilný s typickými rozhraniami TTS (text-to-speech) na prevod textu na reč: SAPI5 (Windows), Dispečer reči (GNU/Linux) A Android Rozhranie API pre prevod textu na reč, ale dá sa použiť aj s čítačkou obrazovky NVDA. Tvorkyňou a hlavnou vývojárkou RHVoice je Olga Yakovleva, ktorá projekt naďalej rozvíja aj napriek tomu, že je úplne slepá.
Nová verzia pridáva 5 nových hlasových možností pre ruskú reč. Bola implementovaná podpora albánskeho jazyka. Ukrajinský slovník bol aktualizovaný. Bola rozšírená podpora pre výslovnosť emoji. V aplikácii platformy boli implementované opravy chýb. Android, import používateľských slovníkov bol zjednodušený a bola pridaná podpora platformy Android 11. Do jadra enginu boli pridané nové nastavenia a funkcie vrátane g2p.case, word_break a podpory pre ekvalizačné filtre.
Pripomeňme, že RHVoice využíva vývoj projektu HTS (HMM/DNN-based Speech Synthesis System) a metódu parametrickej syntézy so štatistickými modelmi (Statistical Parametric Synthesis based on HMM – Hidden Markov Model). Výhodou štatistického modelu sú nízke režijné náklady a nenáročný výkon CPU. Všetky operácie sa vykonávajú lokálne v systéme používateľa. Podporované sú tri úrovne kvality reči (čím nižšia kvalita, tým vyšší výkon a kratší reakčný čas).
Negatívom štatistického modelu je pomerne nízka kvalita výslovnosti, ktorá nedosahuje úroveň syntetizátorov generujúcich reč na základe kombinácie fragmentov prirodzenej reči, no napriek tomu je výsledok celkom čitateľný a pripomína vysielanie nahrávky z reproduktora. . Pre porovnanie, projekt Silero, ktorý poskytuje otvorený motor na syntézu reči založený na technológiách strojového učenia a súbor modelov pre ruský jazyk, je kvalitnejší ako RHVoice.
Pre ruský jazyk je k dispozícii 13 hlasových možností a pre anglický jazyk 5. Hlasy sú tvorené na základe nahrávok prirodzenej reči. V nastaveniach môžete zmeniť rýchlosť, výšku tónu a hlasitosť. Na zmenu tempa je možné použiť knižnicu Sonic. Je možné automaticky zisťovať a prepínať jazyky na základe analýzy vstupného textu (napríklad pre slová a úvodzovky v inom jazyku možno použiť model syntézy natívny pre tento jazyk). Podporované sú hlasové profily, ktoré definujú kombinácie hlasov pre rôzne jazyky.
Zdroj: opennet.ru
