RHVoice 1.8.0 rhyddhau syntheseisydd lleferydd

Rhyddhawyd y system synthesis lleferydd agored RHVoice 1.8.0, a ddatblygwyd i ddechrau i ddarparu cefnogaeth o ansawdd uchel i'r iaith Rwsieg, ond yna fe'i haddaswyd ar gyfer ieithoedd eraill, gan gynnwys Saesneg, Portiwgaleg, Wcreineg, Kyrgyz, Tatar a Sioraidd. Mae'r cod wedi'i ysgrifennu yn C++ a'i ddosbarthu o dan drwydded LGPL 2.1. Yn cefnogi gwaith ar GNU/Linux, Windows ac Android. Mae'r rhaglen yn gydnaws Γ’ rhyngwynebau safonol TTS (testun-i-leferydd) ar gyfer trosi testun i leferydd: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ac Android Text-To-Speech API, ond gellir ei ddefnyddio hefyd yn yr NVDA darllenydd sgrin. Creawdwr a phrif ddatblygwr RHVoice yw Olga Yakovleva, sy'n datblygu'r prosiect er ei fod yn gwbl ddall.

Π’ вСрсии 1.8 для ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° новая систСма управлСния голосовыми ΠΈ языковыми Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠΆΠ°Ρ‚ΡŒ обновлСния голосовых Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· обновлСния мобильного прилоТСния. ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° появлСния ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΉ Π΄Π°Π½Π½Ρ‹Ρ… для Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π½Ρ‹Ρ… голосов ΠΈ языков производится автоматичСски. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π² Π½ΠΎΠ²ΠΎΠΌ выпускС Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° польского языка ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ Π½ΠΎΠ²Ρ‹ΠΉ голос для макСдонского языка. ΠžΠ±Π΅ΡΠΏΠ΅Ρ‡Π΅Π½Π° ΡΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ со свСТими Π°Π»ΡŒΡ„Π°- ΠΈ Π±Π΅Ρ‚Π°-выпусками экранного Ρ€ΠΈΠ΄Π΅Ρ€Π° NVDA. УстранСны ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ со сборкой Π½Π° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ΅ Linux, возникавшиС ΠΏΡ€ΠΈ отсутствии Speech Dispatcher.

Gadewch inni gofio bod RHVoice yn defnyddio datblygiadau'r prosiect HTS (System Synthesis Lleferydd seiliedig ar HMM/DNN) a'r dull synthesis parametrig gyda modelau ystadegol (Synthesis Parametrig Ystadegol yn seiliedig ar HMM - Model Markov Cudd). Mantais y model ystadegol yw costau gorbenion isel a phΕ΅er CPU di-alw. Mae'r holl weithrediadau'n cael eu perfformio'n lleol ar system y defnyddiwr. Cefnogir tair lefel o ansawdd lleferydd (po isaf yw'r ansawdd, yr uchaf yw'r perfformiad a'r byrraf yw'r amser ymateb).

Anfantais y model ystadegol yw ansawdd cymharol isel yr ynganiad, nad yw'n cyrraedd lefel y syntheseisyddion sy'n cynhyrchu lleferydd yn seiliedig ar gyfuniad o ddarnau o lefaru naturiol, ond serch hynny mae'r canlyniad yn eithaf darllenadwy ac yn debyg i ddarlledu recordiad o uchelseinydd. . Er mwyn cymharu, mae'r prosiect Silero, sy'n darparu peiriant synthesis lleferydd agored yn seiliedig ar dechnolegau dysgu peiriant a set o fodelau ar gyfer yr iaith Rwsieg, yn well o ran ansawdd na RHVoice.

Mae 14 opsiwn llais ar gael ar gyfer yr iaith Rwsieg, a 6 ar gyfer Saesneg.Mae'r lleisiau'n cael eu ffurfio yn seiliedig ar recordiadau o lefaru naturiol. Yn y gosodiadau gallwch chi newid y cyflymder, traw a chyfaint. Gellir defnyddio'r llyfrgell Sonic i newid y tempo. Mae'n bosibl canfod a newid ieithoedd yn awtomatig yn seiliedig ar ddadansoddiad o'r testun mewnbwn (er enghraifft, ar gyfer geiriau a dyfyniadau mewn iaith arall, gellir defnyddio model synthesis sy'n frodorol i'r iaith honno). Cefnogir proffiliau llais, gan ddiffinio cyfuniadau o leisiau ar gyfer gwahanol ieithoedd.

Ffynhonnell: opennet.ru

Ychwanegu sylw