Izdanje sintetizatora govora RHVoice 1.2.4, razvijen za ruski jezik

Objavljeno je izdanje otvorenog sustava za sintezu govora RHVoice 1.2.4, koji je prvobitno razvijen za pružanje visokokvalitetne podrške za ruski jezik, ali je zatim prilagođen za druge jezike, uključujući engleski, portugalski, ukrajinski, kirgiški, tatarski i gruzijski. Kod je napisan u C++ i distribuiran pod licencom LGPL 2.1. Podržava rad na GNU/Linuxu, Windowsima i Androidu. Program je kompatibilan sa standardnim TTS (text-to-speech) sučeljima za pretvaranje teksta u govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-To-Speech API, ali se također može koristiti u NVDA čitač zaslona.

Program koristi metodu parametarske sinteze sa statističkim modelima (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Prednost statističkog modela su niski režijski troškovi i nezahtjevna CPU snaga. Sve operacije izvode se lokalno na korisnikovom sustavu. Podržane su tri razine kvalitete govora (što je niža kvaliteta, to je bolja izvedba i kraće vrijeme reakcije).

Podržava postavljanje i promjenu glasova. Dostupno je 9 glasovnih opcija za ruski jezik, a 5 glasova se formiraju na temelju zapisa prirodnog govora. Zbog korištenja statističkog modela, kvaliteta izgovora ne doseže razinu sintesajzera koji generiraju govor na temelju kombinacije fragmenata prirodnog govora, no svejedno rezultat je prilično razumljiv i nalikuje emitiranju snimke s razglasa .

U postavkama možete promijeniti brzinu, visinu i glasnoću. Sonic biblioteka se može koristiti za promjenu tempa. Moguće je automatski detektirati i mijenjati jezike na temelju analize ulaznog teksta (na primjer, za riječi i citate na drugom jeziku može se koristiti model sinteze koji je izvorni za taj jezik). Podržani su glasovni profili koji definiraju kombinacije glasova za različite jezike.

Izvor: opennet.ru

Dodajte komentar