Lëshimi i sintetizuesit të të folurit RHVoice 1.2.4, i zhvilluar për gjuhën ruse

Është publikuar lëshimi i sistemit të hapur të sintezës së të folurit RHVoice 1.2.4, i zhvilluar fillimisht për të ofruar mbështetje me cilësi të lartë për gjuhën ruse, por më pas është përshtatur për gjuhë të tjera, duke përfshirë anglisht, portugalisht, ukrainisht, kirgize, tatarisht dhe gjeorgjisht. Kodi është shkruar në C++ dhe shpërndahet nën licencën LGPL 2.1. Mbështet punën në GNU/Linux, Windows dhe Android. Programi është i pajtueshëm me ndërfaqet standarde TTS (tekst-në-fjalë) për konvertimin e tekstit në të folur: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) dhe Android Text-to-Speech API, por mund të përdoret gjithashtu në NVDA lexues ekrani.

Programi përdor metodën e sintezës parametrike me modele statistikore (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Avantazhi i modelit statistikor është kostoja e ulët e përgjithshme dhe fuqia e pakërkuar e CPU-së. Të gjitha operacionet kryhen në nivel lokal në sistemin e përdoruesit. Mbështeten tre nivele të cilësisë së të folurit (sa më e ulët të jetë cilësia, aq më e lartë është performanca dhe aq më e shkurtër është koha e reagimit).

Mbështet vendosjen dhe ndryshimin e zërave. Ekzistojnë 9 opsione zanore për gjuhën ruse dhe 5 për anglisht. Zërat formohen në bazë të regjistrimeve të të folurit natyror. Për shkak të përdorimit të një modeli statistikor, cilësia e shqiptimit nuk arrin nivelin e sintetizuesve që gjenerojnë fjalim bazuar në një kombinim të fragmenteve të të folurit natyror, por megjithatë rezultati është mjaft i kuptueshëm dhe i ngjan një transmetimi të një regjistrimi nga një altoparlant. .

Në cilësimet mund të ndryshoni shpejtësinë, lartësinë dhe volumin. Biblioteka Sonic mund të përdoret për të ndryshuar ritmin. Është e mundur që automatikisht të zbulohen dhe të ndërrohen gjuhët bazuar në analizën e tekstit hyrës (për shembull, për fjalët dhe thëniet në një gjuhë tjetër, mund të përdoret një model sinteze amtare në atë gjuhë). Profilet e zërit mbështeten, duke përcaktuar kombinimet e zërave për gjuhë të ndryshme.

Burimi: opennet.ru

Shto një koment