Izdanje sintetizatora govora RHVoice 1.8.0

Pušten je sustav za sintezu govora otvorenog koda RHVoice 1.8.0, u početku razvijen za pružanje visokokvalitetne podrške za ruski jezik, ali zatim prilagođen za druge jezike, uključujući engleski, portugalski, ukrajinski, kirgiški, tatarski i gruzijski. Kod je napisan u C++ i distribuiran pod licencom LGPL 2.1. Rad je podržan u GNU/Linuxu, Windowsima i Androidu. Program je kompatibilan s tipičnim TTS (text-to-speech) sučeljima za pretvaranje teksta u govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-To-Speech API, ali se također može koristiti u NVDA čitač zaslona. Tvorac i glavni programer RHVoicea je Olga Yakovleva, koja razvija projekt iako je potpuno slijepa.

Verzija 1.8 za platformu Android uvodi novi sustav upravljanja glasovnim i jezičnim podacima koji vam omogućuje preuzimanje ažuriranja glasovnih podataka bez ažuriranja mobilne aplikacije. Provjera ažuriranja podataka za dodane glasove i jezike obavlja se automatski. Osim toga, novo izdanje uvodi podršku za poljski jezik i dodaje novi glas za makedonski jezik. Osigurana kompatibilnost s nedavnim alfa i beta izdanjima NVDA čitača zaslona. Riješeni su problemi s međugradnjom Linuxa koji su se javljali kada dispečer govora nije bio prisutan.

Podsjetimo, RHVoice koristi razvoj HTS projekta (HMM / DNN-based Speech Synthesis System) i metodu parametarske sinteze sa statističkim modelima (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Prednost statističkog modela je nisko opterećenje i nezahtjevna CPU snaga. Sve operacije izvode se lokalno na korisnikovom sustavu. Podržane su tri razine kvalitete govora (što je niža kvaliteta, to je bolja izvedba i kraće vrijeme odziva).

Nedostatak statističkog modela je relativno niska kvaliteta izgovora, koja ne doseže razinu sintesajzera koji generiraju govor na temelju kombinacije fragmenata prirodnog govora, ali unatoč tome rezultat je prilično čitljiv i nalikuje emitiranoj snimci s razglasa . Za usporedbu, projekt Silero, koji pruža otvoreni motor za sintezu govora temeljen na tehnologijama strojnog učenja i nizu modela za ruski jezik, kvalitetom nadmašuje RHVoice.

Za ruski jezik dostupno je 14 glasovnih opcija, za engleski - 6. Glasovi se formiraju na temelju zapisa prirodnog govora. U postavkama možete promijeniti brzinu, visinu i glasnoću. Sonic biblioteka se može koristiti za promjenu tempa. Moguće je automatski detektirati i promijeniti jezik na temelju analize ulaznog teksta (na primjer, za riječi i citate na drugom jeziku, može se koristiti izvorni model sinteze za ovaj jezik). Podržani su glasovni profili koji definiraju kombinacije glasova za različite jezike.

Izvor: opennet.ru

Dodajte komentar