Az orosz nyelvre kifejlesztett RHVoice 1.2.4 beszédszintetizátor kiadása

Megjelent az RHVoice 1.2.4 nyílt beszédszintézis rendszer kiadása, amelyet eredetileg az orosz nyelv magas színvonalú támogatására fejlesztettek ki, de aztán más nyelvekre, köztük angolra, portugálra, ukránra, kirgizre, tatárra és grúzra adaptálták. A kód C++ nyelven íródott, és az LGPL 2.1 licenc alatt terjeszthető. Támogatja a munkát GNU/Linux, Windows és Android rendszeren. A program kompatibilis a szabványos TTS (text-to-speech) interfészekkel a szöveg beszédké alakítására: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) és Android Text-To-Speech API, de használható az NVDA-ban is. képernyőolvasó.

A program a parametrikus szintézis módszerét használja statisztikai modellekkel (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). A statisztikai modell előnye az alacsony rezsiköltségek és az igénytelen CPU teljesítmény. Minden művelet helyileg, a felhasználó rendszerén történik. A beszédminőség három szintje támogatott (minél alacsonyabb a minőség, annál nagyobb a teljesítmény és annál rövidebb a reakcióidő).

Támogatja a hangok beállítását és megváltoztatását. Orosz nyelvhez 9, angolhoz 5 hangbeállítás áll rendelkezésre. A statisztikai modell alkalmazása miatt a kiejtés minősége nem éri el a természetes beszédtöredékek kombinációja alapján beszédet generáló szintetizátorok szintjét, de ennek ellenére az eredmény meglehetősen érthető, és hangszóróból készült felvétel sugárzására emlékeztet. .

A beállításokban módosíthatja a sebességet, a hangmagasságot és a hangerőt. A Sonic könyvtár használható a tempó megváltoztatására. Lehetőség van a bemeneti szöveg elemzése alapján automatikusan felismerni és váltani a nyelveket (például egy másik nyelv szavaihoz és idézőjeleihez az adott nyelven natív szintézis modell használható). A hangprofilok támogatottak, amelyek a különböző nyelvek hangkombinációit határozzák meg.

Forrás: opennet.ru

Hozzászólás