Izdanje sintisajzera govora RHVoice 1.2.4, razvijen za ruski jezik

Objavljeno je izdanje otvorenog sistema za sintezu govora RHVoice 1.2.4, koji je prvobitno razvijen da pruži visokokvalitetnu podršku za ruski jezik, ali je potom prilagođen za druge jezike, uključujući engleski, portugalski, ukrajinski, kirgiski, tatarski i gruzijski. Kod je napisan u C++ i distribuira se pod licencom LGPL 2.1. Podržava rad na GNU/Linux, Windows i Android. Program je kompatibilan sa standardnim TTS (text-to-speech) sučeljima za pretvaranje teksta u govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-To-Speech API, ali se također može koristiti u NVDA čitač ekrana.

Program koristi metod parametarske sinteze sa statističkim modelima (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Prednost statističkog modela su niski režijski troškovi i nezahtjevna CPU snaga. Sve operacije se izvode lokalno na korisnikovom sistemu. Podržana su tri nivoa kvaliteta govora (što je niži kvalitet, to su performanse veće i vreme reakcije kraće).

Podržava podešavanje i promjenu glasova. Za ruski jezik je dostupno 9 glasovnih opcija, a za engleski 5. Glasovi se formiraju na osnovu snimaka prirodnog govora. Zbog upotrebe statističkog modela, kvalitet izgovora ne dostiže nivo sintisajzera koji generišu govor na osnovu kombinacije fragmenata prirodnog govora, ali je ipak rezultat prilično razumljiv i nalikuje emitovanju snimka sa zvučnika. .

U postavkama možete promijeniti brzinu, visinu i jačinu zvuka. Sonic biblioteka se može koristiti za promjenu tempa. Moguće je automatski otkriti i prebaciti jezike na osnovu analize ulaznog teksta (na primjer, za riječi i citate na drugom jeziku, može se koristiti model sinteze koji je izvorni za taj jezik). Podržani su glasovni profili koji definišu kombinacije glasova za različite jezike.

izvor: opennet.ru

Dodajte komentar