RHVoice 1.6.0 izdanje sintisajzera govora

Objavljen je sistem za sintezu otvorenog govora RHVoice 1.6.0, prvobitno razvijen da pruži visokokvalitetnu podršku za ruski jezik, ali je potom prilagođen za druge jezike, uključujući engleski, portugalski, ukrajinski, kirgiški, tatarski i gruzijski. Kod je napisan u C++ i distribuira se pod licencom LGPL 2.1. Podržava rad na GNU/Linux, Windows i Android. Program je kompatibilan sa standardnim TTS (text-to-speech) sučeljima za pretvaranje teksta u govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-To-Speech API, ali se također može koristiti u NVDA čitač ekrana. Kreator i glavni programer RHVoicea je Olga Yakovleva, koja razvija projekat iako je potpuno slijepa.

Nova verzija dodaje 5 novih glasovnih opcija za ruski govor. Podrška albanskom jeziku je implementirana. Rečnik ukrajinskog jezika je ažuriran. Podrška za glasovnu glumu emoji likova je proširena. Urađeno je na otklanjanju grešaka u aplikaciji za Android platformu, pojednostavljen je uvoz prilagođenih rječnika, a dodata je i podrška za platformu Android 11. U jezgru motora su dodane nove postavke i funkcionalnost, uključujući g2p. case, word_break i podrška za filtere ekvilizacije.

Podsjetimo, RHVoice koristi razvoj HTS projekta (HMM/DNN-based Speech Synthesis System) i parametarsku metodu sinteze sa statističkim modelima (Statistical Parametric Synthesis based on HMM – Hidden Markov Model). Prednost statističkog modela su niski režijski troškovi i nezahtjevna CPU snaga. Sve operacije se izvode lokalno na korisnikovom sistemu. Podržana su tri nivoa kvaliteta govora (što je niži kvalitet, to su performanse veće i vreme reakcije kraće).

Nedostatak statističkog modela je relativno nizak kvalitet izgovora, koji ne dostiže nivo sintisajzera koji generišu govor na osnovu kombinacije fragmenata prirodnog govora, ali je ipak rezultat prilično čitljiv i nalikuje emitovanju snimka sa zvučnika. . Poređenja radi, projekat Silero, koji obezbeđuje motor za sintezu otvorenog govora zasnovan na tehnologijama mašinskog učenja i skup modela za ruski jezik, superiorniji je u kvaliteti od RHVoicea.

Za ruski jezik je dostupno 13 glasovnih opcija, a za engleski 5. Glasovi se formiraju na osnovu snimaka prirodnog govora. U postavkama možete promijeniti brzinu, visinu i jačinu zvuka. Sonic biblioteka se može koristiti za promjenu tempa. Moguće je automatski otkriti i prebaciti jezike na osnovu analize ulaznog teksta (na primjer, za riječi i citate na drugom jeziku, može se koristiti model sinteze koji je izvorni za taj jezik). Podržani su glasovni profili koji definišu kombinacije glasova za različite jezike.

izvor: opennet.ru

Dodajte komentar