RHVoice 1.8.0 izdanje sintisajzera govora

Objavljen je sistem za sintezu otvorenog govora RHVoice 1.8.0, prvobitno razvijen da pruži visokokvalitetnu podršku za ruski jezik, ali je potom prilagođen za druge jezike, uključujući engleski, portugalski, ukrajinski, kirgiški, tatarski i gruzijski. Kod je napisan u C++ i distribuira se pod licencom LGPL 2.1. Podržava rad na GNU/Linux, Windows i Android. Program je kompatibilan sa standardnim TTS (text-to-speech) sučeljima za pretvaranje teksta u govor: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) i Android Text-To-Speech API, ali se također može koristiti u NVDA čitač ekrana. Kreator i glavni programer RHVoicea je Olga Yakovleva, koja razvija projekat iako je potpuno slijepa.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Podsjetimo, RHVoice koristi razvoj HTS projekta (HMM/DNN-based Speech Synthesis System) i parametarsku metodu sinteze sa statističkim modelima (Statistical Parametric Synthesis based on HMM – Hidden Markov Model). Prednost statističkog modela su niski režijski troškovi i nezahtjevna CPU snaga. Sve operacije se izvode lokalno na korisnikovom sistemu. Podržana su tri nivoa kvaliteta govora (što je niži kvalitet, to su performanse veće i vreme reakcije kraće).

Nedostatak statističkog modela je relativno nizak kvalitet izgovora, koji ne dostiže nivo sintisajzera koji generišu govor na osnovu kombinacije fragmenata prirodnog govora, ali je ipak rezultat prilično čitljiv i nalikuje emitovanju snimka sa zvučnika. . Poređenja radi, projekat Silero, koji obezbeđuje motor za sintezu otvorenog govora zasnovan na tehnologijama mašinskog učenja i skup modela za ruski jezik, superiorniji je u kvaliteti od RHVoicea.

Za ruski jezik je dostupno 14 glasovnih opcija, a za engleski 6. Glasovi se formiraju na osnovu snimaka prirodnog govora. U postavkama možete promijeniti brzinu, visinu i jačinu zvuka. Sonic biblioteka se može koristiti za promjenu tempa. Moguće je automatski otkriti i prebaciti jezike na osnovu analize ulaznog teksta (na primjer, za riječi i citate na drugom jeziku, može se koristiti model sinteze koji je izvorni za taj jezik). Podržani su glasovni profili koji definišu kombinacije glasova za različite jezike.

izvor: opennet.ru

Dodajte komentar