Gefa út talgervil RHVoice 1.2.4, þróað fyrir rússneska tungumál

Útgáfa opna talgervilskerfisins RHVoice 1.2.4 hefur verið gefin út, upphaflega þróað til að veita hágæða stuðning fyrir rússnesku, en síðan aðlagað fyrir önnur tungumál, þar á meðal ensku, portúgölsku, úkraínsku, kirgísnesku, tatarísku og georgísku. Kóðinn er skrifaður í C++ og dreift undir LGPL 2.1 leyfinu. Styður vinnu á GNU/Linux, Windows og Android. Forritið er samhæft við venjuleg TTS (text-til-tal) viðmót til að breyta texta í tal: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) og Android Text-To-Speech API, en einnig er hægt að nota það í NVDA skjálesari.

Forritið notar parametric synthesis aðferðina með tölfræðilegum líkönum (Statistical Parametric Synthesis byggt á HMM - Hidden Markov Model). Kosturinn við tölfræðilíkanið er lágur kostnaður og krefjandi örgjörvaafl. Allar aðgerðir eru framkvæmdar á staðnum á kerfi notandans. Þrjú stig talgæða eru studd (því minni sem gæðin eru, því meiri frammistaða og því styttri viðbragðstími).

Styður stillingar og breytingar á röddum. Það eru 9 raddvalkostir í boði fyrir rússnesku og 5 fyrir ensku. Raddirnar eru myndaðar út frá upptökum af náttúrulegu tali. Vegna notkunar á tölfræðilegu líkani ná gæði framburðar ekki það stigi sem hljóðgervlar búa til tal byggt á samsetningu brota af náttúrulegu tali, en engu að síður er útkoman nokkuð skiljanleg og líkist útsendingu af upptöku úr hátalara. .

Í stillingunum er hægt að breyta hraða, tónhæð og hljóðstyrk. Hægt er að nota Sonic bókasafnið til að breyta taktinum. Það er hægt að greina og skipta sjálfkrafa um tungumál byggt á greiningu á inntakstextanum (til dæmis, fyrir orð og tilvitnanir á öðru tungumáli, er hægt að nota samrunalíkan sem er innfæddur í því tungumáli). Raddsnið eru studd, sem skilgreina samsetningar radda fyrir mismunandi tungumál.

Heimild: opennet.ru

Bæta við athugasemd