Izdaja sintetizatorja govora RHVoice 1.2.4, razvitega za ruski jezik

Objavljena je bila izdaja odprtega sistema za sintezo govora RHVoice 1.2.4, ki je bil prvotno razvit za zagotavljanje visokokakovostne podpore za ruski jezik, nato pa prilagojen za druge jezike, vključno z angleščino, portugalščino, ukrajinščino, kirgiščino, tatarščino in gruzijščino. Koda je napisana v C++ in se distribuira pod licenco LGPL 2.1. Podpira delo na GNU/Linux, Windows in Android. Program je združljiv s standardnimi vmesniki TTS (besedilo v govor) za pretvorbo besedila v govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) in Android Text-To-Speech API, lahko pa se uporablja tudi v NVDA bralnik zaslona.

Program uporablja metodo parametrične sinteze s statističnimi modeli (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Prednost statističnega modela so nizki režijski stroški in nezahtevna procesorska moč. Vse operacije se izvajajo lokalno v uporabnikovem sistemu. Podprte so tri ravni kakovosti govora (nižja kot je kakovost, višja je zmogljivost in krajši reakcijski čas).

Podpira nastavitev in spreminjanje glasov. Na voljo je 9 glasovnih možnosti za ruski jezik, 5 glasov pa je oblikovanih na podlagi posnetkov naravnega govora. Zaradi uporabe statističnega modela kakovost izgovorjave ne dosega ravni sintetizatorjev, ki generirajo govor na podlagi kombinacije fragmentov naravnega govora, kljub temu pa je rezultat precej razumljiv in spominja na predvajanje posnetka iz zvočnika. .

V nastavitvah lahko spremenite hitrost, višino in glasnost. Knjižnico Sonic lahko uporabite za spreminjanje tempa. Možno je samodejno zaznavanje in preklapljanje med jeziki na podlagi analize vnesenega besedila (na primer za besede in citate v drugem jeziku je mogoče uporabiti sintezni model, ki je izviren iz tega jezika). Podprti so glasovni profili, ki določajo kombinacije glasov za različne jezike.

Vir: opennet.ru

Dodaj komentar