RHVoice 1.6.0 rhyddhau syntheseisydd lleferydd

Rhyddhawyd y system synthesis lleferydd agored RHVoice 1.6.0, a ddatblygwyd i ddechrau i ddarparu cefnogaeth o ansawdd uchel i'r iaith Rwsieg, ond yna fe'i haddaswyd ar gyfer ieithoedd eraill, gan gynnwys Saesneg, Portiwgaleg, Wcreineg, Kyrgyz, Tatar a Sioraidd. Mae'r cod wedi'i ysgrifennu yn C++ a'i ddosbarthu o dan drwydded LGPL 2.1. Yn cefnogi gwaith ar GNU/Linux, Windows ac Android. Mae'r rhaglen yn gydnaws Γ’ rhyngwynebau safonol TTS (testun-i-leferydd) ar gyfer trosi testun i leferydd: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ac Android Text-To-Speech API, ond gellir ei ddefnyddio hefyd yn yr NVDA darllenydd sgrin. Creawdwr a phrif ddatblygwr RHVoice yw Olga Yakovleva, sy'n datblygu'r prosiect er ei fod yn gwbl ddall.

Mae'r fersiwn newydd yn ychwanegu 5 opsiwn llais newydd ar gyfer lleferydd Rwsieg. Mae cymorth iaith Albaneg wedi'i roi ar waith. Mae'r geiriadur ar gyfer yr iaith Wcreineg wedi'i ddiweddaru. Mae cefnogaeth ar gyfer actio cymeriadau emoji gyda llais wedi'i ehangu. Mae gwaith wedi'i wneud i ddileu gwallau yn y cymhwysiad ar gyfer platfform Android, mae mewnforio geiriaduron arfer wedi'i symleiddio, ac mae cefnogaeth ar gyfer platfform Android 11 wedi'i ychwanegu. Mae gosodiadau ac ymarferoldeb newydd wedi'u hychwanegu at graidd yr injan, gan gynnwys g2p. achos, word_break a chefnogaeth ar gyfer hidlwyr cydraddoli.

Gadewch inni gofio bod RHVoice yn defnyddio datblygiadau'r prosiect HTS (System Synthesis Lleferydd seiliedig ar HMM/DNN) a'r dull synthesis parametrig gyda modelau ystadegol (Synthesis Parametrig Ystadegol yn seiliedig ar HMM - Model Markov Cudd). Mantais y model ystadegol yw costau gorbenion isel a phΕ΅er CPU di-alw. Mae'r holl weithrediadau'n cael eu perfformio'n lleol ar system y defnyddiwr. Cefnogir tair lefel o ansawdd lleferydd (po isaf yw'r ansawdd, yr uchaf yw'r perfformiad a'r byrraf yw'r amser ymateb).

Anfantais y model ystadegol yw ansawdd cymharol isel yr ynganiad, nad yw'n cyrraedd lefel y syntheseisyddion sy'n cynhyrchu lleferydd yn seiliedig ar gyfuniad o ddarnau o lefaru naturiol, ond serch hynny mae'r canlyniad yn eithaf darllenadwy ac yn debyg i ddarlledu recordiad o uchelseinydd. . Er mwyn cymharu, mae'r prosiect Silero, sy'n darparu peiriant synthesis lleferydd agored yn seiliedig ar dechnolegau dysgu peiriant a set o fodelau ar gyfer yr iaith Rwsieg, yn well o ran ansawdd na RHVoice.

Mae 13 opsiwn llais ar gael ar gyfer yr iaith Rwsieg, a 5 ar gyfer Saesneg.Mae'r lleisiau'n cael eu ffurfio yn seiliedig ar recordiadau o lefaru naturiol. Yn y gosodiadau gallwch chi newid y cyflymder, traw a chyfaint. Gellir defnyddio'r llyfrgell Sonic i newid y tempo. Mae'n bosibl canfod a newid ieithoedd yn awtomatig yn seiliedig ar ddadansoddiad o'r testun mewnbwn (er enghraifft, ar gyfer geiriau a dyfyniadau mewn iaith arall, gellir defnyddio model synthesis sy'n frodorol i'r iaith honno). Cefnogir proffiliau llais, gan ddiffinio cyfuniadau o leisiau ar gyfer gwahanol ieithoedd.

Ffynhonnell: opennet.ru

Ychwanegu sylw