Выпуск синтСзатора Ρ€Π΅Ρ‡ΠΈ RHVoice 1.8.0

Бостоялся выпуск ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΉ систСмы синтСза Ρ€Π΅Ρ‡ΠΈ RHVoice 1.8.0, ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ Ρ€Π°Π·Π²ΠΈΠ²Π°Π²ΡˆΠ΅ΠΉΡΡ для обСспСчСния качСствСнной ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ русского языка, Π½ΠΎ Π·Π°Ρ‚Π΅ΠΌ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΈ для Π΄Ρ€ΡƒΠ³ΠΈΡ… языков, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ английский, ΠΏΠΎΡ€Ρ‚ΡƒΠ³Π°Π»ΡŒΡΠΊΠΈΠΉ, украинский, киргизский, татарский ΠΈ грузинский. Код написан Π½Π° Π‘++ ΠΈ распространяСтся ΠΏΠΎΠ΄ Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ LGPL 2.1. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ€Π°Π±ΠΎΡ‚Π° Π² GNU/Linux, Windows ΠΈ Android. ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° совмСстима с Ρ‚ΠΈΠΏΠΎΠ²Ρ‹ΠΌΠΈ TTS-интСрфСйсами (text-to-speech) для прСобразования тСкста Π² Ρ€Π΅Ρ‡ΡŒ: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ΠΈ Android Text-To-Speech API, Π½ΠΎ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² экранном Ρ€ΠΈΠ΄Π΅Ρ€Π΅ NVDA. Π‘ΠΎΠ·Π΄Π°Ρ‚Π΅Π»Π΅ΠΌ ΠΈ основным Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠΌ RHVoice являСтся Ольга Π―ΠΊΠΎΠ²Π»Π΅Π²Π°, которая Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅Ρ‚ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ нСсмотря Π½Π° ΠΏΠΎΠ»Π½ΡƒΡŽ слСпоту.

Π’ вСрсии 1.8 для ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° новая систСма управлСния голосовыми ΠΈ языковыми Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠΆΠ°Ρ‚ΡŒ обновлСния голосовых Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· обновлСния мобильного прилоТСния. ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° появлСния ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΉ Π΄Π°Π½Π½Ρ‹Ρ… для Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π½Ρ‹Ρ… голосов ΠΈ языков производится автоматичСски. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π² Π½ΠΎΠ²ΠΎΠΌ выпускС Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° польского языка ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ Π½ΠΎΠ²Ρ‹ΠΉ голос для макСдонского языка. ΠžΠ±Π΅ΡΠΏΠ΅Ρ‡Π΅Π½Π° ΡΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ со свСТими Π°Π»ΡŒΡ„Π°- ΠΈ Π±Π΅Ρ‚Π°-выпусками экранного Ρ€ΠΈΠ΄Π΅Ρ€Π° NVDA. УстранСны ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ со сборкой Π½Π° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ΅ Linux, возникавшиС ΠΏΡ€ΠΈ отсутствии Speech Dispatcher.

Напомним, Ρ‡Ρ‚ΠΎ Π² RHVoice ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π½Π°Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° HTS (HMM/DNN-based Speech Synthesis System) ΠΈ парамСтричСский ΠΌΠ΅Ρ‚ΠΎΠ΄ синтСза со статистичСскими модСлями (Statistical Parametric Synthesis Π½Π° Π±Π°Π·Π΅ HMM — Hidden Markov Model). Плюсом статистичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½ΠΈΠ·ΠΊΠΈΠ΅ Π½Π°ΠΊΠ»Π°Π΄Π½Ρ‹Π΅ расходы ΠΈ Π½Π΅Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΊ мощности CPU. ВсС ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ локально Π½Π° систСмС ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚Ρ€ΠΈ уровня качСства Ρ€Π΅Ρ‡ΠΈ (Ρ‡Π΅ΠΌ Π½ΠΈΠΆΠ΅ качСство — Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ мСньшС врСмя Ρ€Π΅Π°ΠΊΡ†ΠΈΠΈ).

ΠœΠΈΠ½ΡƒΡΠΎΠΌ статистичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ являСтся ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½ΠΈΠ·ΠΊΠΎΠ΅ качСство ΠΏΡ€ΠΎΠΈΠ·Π½ΠΎΡˆΠ΅Π½ΠΈΡ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π΅ достигаСт уровня синтСзаторов, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… Ρ€Π΅Ρ‡ΡŒ Π½Π° основС ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚ΠΎΠ² СстСствСнной Ρ€Π΅Ρ‡ΠΈ, Π½ΠΎ Ρ‚Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π²ΠΏΠΎΠ»Π½Π΅ Ρ€Π°Π·Π±ΠΎΡ€Ρ‡ΠΈΠ² ΠΈ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ Ρ‚Ρ€Π°Π½ΡΠ»ΡΡ†ΠΈΡŽ записи с громкоговоритСля. Для сравнСния, ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Silero, ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ Π΄Π²ΠΈΠΆΠΎΠΊ для синтСза Ρ€Π΅Ρ‡ΠΈ Π½Π° основС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ машинного обучСния ΠΈ Π½Π°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ для русского языка, ΠΏΠΎ качСству прСвосходит RHVoice.

Для русского языка доступно 14 Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² голосов, для английского — 6. Голоса Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π½Π° основС записСй СстСствСнной Ρ€Π΅Ρ‡ΠΈ. Π’ настройках ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ, высоту ΠΈ Π³Ρ€ΠΎΠΌΠΊΠΎΡΡ‚ΡŒ. Для измСнСния Ρ‚Π΅ΠΌΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° Sonic. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ автоматичСскоС ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ языка Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ тСкста (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, для слов ΠΈ Ρ†ΠΈΡ‚Π°Ρ‚ Π½Π° Π΄Ρ€ΡƒΠ³ΠΎΠΌ языкС ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ родная для Π΄Π°Π½Π½ΠΎΠ³ΠΎ языка модСль синтСза). ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ голосовыС ΠΏΡ€ΠΎΡ„ΠΈΠ»ΠΈ, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠ΅ сочСтания голосов для Ρ€Π°Π·Π½Ρ‹Ρ… языков.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: opennet.ru

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ