Rhyddhawyd y system synthesis lleferydd agored RHVoice 1.8.0, a ddatblygwyd i ddechrau i ddarparu cefnogaeth o ansawdd uchel i'r iaith Rwsieg, ond yna fe'i haddaswyd ar gyfer ieithoedd eraill, gan gynnwys Saesneg, Portiwgaleg, Wcreineg, Kyrgyz, Tatar a Sioraidd. Mae'r cod wedi'i ysgrifennu yn C++ a'i ddosbarthu o dan drwydded LGPL 2.1. Yn cefnogi gwaith ar GNU/Linux, Windows ac Android. Mae'r rhaglen yn gydnaws Γ’ rhyngwynebau safonol TTS (testun-i-leferydd) ar gyfer trosi testun i leferydd: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ac Android Text-To-Speech API, ond gellir ei ddefnyddio hefyd yn yr NVDA darllenydd sgrin. Creawdwr a phrif ddatblygwr RHVoice yw Olga Yakovleva, sy'n datblygu'r prosiect er ei fod yn gwbl ddall.
Π Π²Π΅ΡΡΠΈΠΈ 1.8 Π΄Π»Ρ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ Android ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½Π° Π½ΠΎΠ²Π°Ρ ΡΠΈΡΡΠ΅ΠΌΠ° ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΠΌΠΈ ΠΈ ΡΠ·ΡΠΊΠΎΠ²ΡΠΌΠΈ Π΄Π°Π½Π½ΡΠΌΠΈ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡΡΠ°Ρ Π·Π°Π³ΡΡΠΆΠ°ΡΡ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΡ Π΄Π°Π½Π½ΡΡ Π±Π΅Π· ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ ΠΌΠΎΠ±ΠΈΠ»ΡΠ½ΠΎΠ³ΠΎ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ. ΠΡΠΎΠ²Π΅ΡΠΊΠ° ΠΏΠΎΡΠ²Π»Π΅Π½ΠΈΡ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΉ Π΄Π°Π½Π½ΡΡ Π΄Π»Ρ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π½ΡΡ Π³ΠΎΠ»ΠΎΡΠΎΠ² ΠΈ ΡΠ·ΡΠΊΠΎΠ² ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΡΡ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈ. ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, Π² Π½ΠΎΠ²ΠΎΠΌ Π²ΡΠΏΡΡΠΊΠ΅ ΡΠ΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΏΠΎΠ»ΡΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ Π½ΠΎΠ²ΡΠΉ Π³ΠΎΠ»ΠΎΡ Π΄Π»Ρ ΠΌΠ°ΠΊΠ΅Π΄ΠΎΠ½ΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°. ΠΠ±Π΅ΡΠΏΠ΅ΡΠ΅Π½Π° ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΠΎΡΡΡ ΡΠΎ ΡΠ²Π΅ΠΆΠΈΠΌΠΈ Π°Π»ΡΡΠ°- ΠΈ Π±Π΅ΡΠ°-Π²ΡΠΏΡΡΠΊΠ°ΠΌΠΈ ΡΠΊΡΠ°Π½Π½ΠΎΠ³ΠΎ ΡΠΈΠ΄Π΅ΡΠ° NVDA. Π£ΡΡΡΠ°Π½Π΅Π½Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ ΡΠΎ ΡΠ±ΠΎΡΠΊΠΎΠΉ Π½Π° ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ΅ Linux, Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π²ΡΠΈΠ΅ ΠΏΡΠΈ ΠΎΡΡΡΡΡΡΠ²ΠΈΠΈ Speech Dispatcher.
Gadewch inni gofio bod RHVoice yn defnyddio datblygiadau'r prosiect HTS (System Synthesis Lleferydd seiliedig ar HMM/DNN) a'r dull synthesis parametrig gyda modelau ystadegol (Synthesis Parametrig Ystadegol yn seiliedig ar HMM - Model Markov Cudd). Mantais y model ystadegol yw costau gorbenion isel a phΕ΅er CPU di-alw. Mae'r holl weithrediadau'n cael eu perfformio'n lleol ar system y defnyddiwr. Cefnogir tair lefel o ansawdd lleferydd (po isaf yw'r ansawdd, yr uchaf yw'r perfformiad a'r byrraf yw'r amser ymateb).
Anfantais y model ystadegol yw ansawdd cymharol isel yr ynganiad, nad yw'n cyrraedd lefel y syntheseisyddion sy'n cynhyrchu lleferydd yn seiliedig ar gyfuniad o ddarnau o lefaru naturiol, ond serch hynny mae'r canlyniad yn eithaf darllenadwy ac yn debyg i ddarlledu recordiad o uchelseinydd. . Er mwyn cymharu, mae'r prosiect Silero, sy'n darparu peiriant synthesis lleferydd agored yn seiliedig ar dechnolegau dysgu peiriant a set o fodelau ar gyfer yr iaith Rwsieg, yn well o ran ansawdd na RHVoice.
Mae 14 opsiwn llais ar gael ar gyfer yr iaith Rwsieg, a 6 ar gyfer Saesneg.Mae'r lleisiau'n cael eu ffurfio yn seiliedig ar recordiadau o lefaru naturiol. Yn y gosodiadau gallwch chi newid y cyflymder, traw a chyfaint. Gellir defnyddio'r llyfrgell Sonic i newid y tempo. Mae'n bosibl canfod a newid ieithoedd yn awtomatig yn seiliedig ar ddadansoddiad o'r testun mewnbwn (er enghraifft, ar gyfer geiriau a dyfyniadau mewn iaith arall, gellir defnyddio model synthesis sy'n frodorol i'r iaith honno). Cefnogir proffiliau llais, gan ddiffinio cyfuniadau o leisiau ar gyfer gwahanol ieithoedd.
Ffynhonnell: opennet.ru