Rilaxx ta' sintetizzatur tad-diskors RHVoice 1.8.0

Is-sistema ta 'sintesi tad-diskors miftuħ RHVoice 1.8.0 ġiet rilaxxata, inizjalment żviluppata biex tipprovdi appoġġ ta' kwalità għolja għal-lingwa Russa, iżda mbagħad adattata għal lingwi oħra, inklużi l-Ingliż, Portugiż, Ukrain, Kirgiż, Tatar u Ġorġjan. Il-kodiċi huwa miktub f'C++ u mqassam taħt il-liċenzja LGPL 2.1. Jappoġġja xogħol fuq GNU/Linux, Windows u Android. Il-programm huwa kompatibbli ma 'interfaces standard TTS (test-to-speech) għall-konverżjoni ta' test għal diskors: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) u Android Text-To-Speech API, iżda jista 'jintuża wkoll fl-NVDA screen reader. Il-kreatur u l-iżviluppatur ewlieni ta 'RHVoice hija Olga Yakovleva, li tiżviluppa l-proġett minkejja li hija kompletament għomja.

Verżjoni 1.8 għall-pjattaforma Android tintroduċi sistema ġdida ta 'ġestjoni tad-dejta tal-vuċi u tal-lingwa li tippermettilek tniżżel aġġornamenti tad-dejta tal-vuċi mingħajr ma taġġorna l-applikazzjoni mobbli. L-aġġornamenti tad-dejta għal vuċijiet u lingwi miżjuda huma kkontrollati awtomatikament. Barra minn hekk, ir-rilaxx il-ġdid jintroduċi appoġġ għal-lingwa Pollakka u żżid vuċi ġdida għal-lingwa Maċedonjana. Il-kompatibbiltà mal-aħħar rilaxxi alfa u beta tal-iskrin tal-qarrej tal-NVDA hija żgurata. Fissi problemi bil-bini fuq il-pjattaforma Linux li seħħew meta Speech Dispatcher ma kienx preżenti.

Ejja nfakkru li RHVoice juża l-iżviluppi tal-proġett HTS (Sistema ta 'Sinteżi tad-Diskors ibbażata fuq HMM/DNN) u l-metodu ta' sinteżi parametrika b'mudelli statistiċi (Sinteżi Parametrika Statistika bbażata fuq HMM - Mudell Markov Moħbi). Il-vantaġġ tal-mudell statistiku huwa spejjeż ġenerali baxxi u qawwa tas-CPU mhux impenjattiva. L-operazzjonijiet kollha jsiru lokalment fuq is-sistema tal-utent. Tliet livelli ta 'kwalità tad-diskors huma appoġġjati (aktar ma tkun baxxa l-kwalità, iktar ikun għoli l-prestazzjoni u iqsar il-ħin ta' reazzjoni).

L-iżvantaġġ tal-mudell statistiku huwa l-kwalità relattivament baxxa tal-pronunzja, li ma tilħaqx il-livell ta 'sintetizzaturi li jiġġeneraw diskors ibbażat fuq taħlita ta' frammenti ta 'diskors naturali, iżda madankollu r-riżultat huwa pjuttost leġibbli u jixbah ix-xandir ta' reġistrazzjoni minn lawdspiker . Għal tqabbil, il-proġett Silero, li jipprovdi magna ta 'sintesi tad-diskors miftuħ ibbażata fuq teknoloġiji ta' tagħlim bil-magni u sett ta 'mudelli għal-lingwa Russa, huwa ta' kwalità superjuri għal RHVoice.

Hemm 14-il għażla tal-vuċi disponibbli għall-lingwa Russa, u għall-Ingliż 6. Il-vuċijiet huma ffurmati abbażi ta 'reġistrazzjonijiet ta' diskors naturali. Fis-settings tista 'tbiddel il-veloċità, il-pitch u l-volum. Il-librerija Sonic tista 'tintuża biex tbiddel il-tempo. Huwa possibbli li awtomatikament jinstabu u jaqilbu l-lingwi abbażi tal-analiżi tat-test tal-input (pereżempju, għal kliem u kwotazzjonijiet f'lingwa oħra, jista 'jintuża mudell ta' sinteżi nattiv għal dik il-lingwa). Il-profili tal-vuċi huma appoġġjati, li jiddefinixxu kombinazzjonijiet ta 'vuċi għal lingwi differenti.

Sors: opennet.ru

Żid kumment