Выпуск синтСзатора Ρ€Π΅Ρ‡ΠΈ RHVoice 1.6.0

Бостоялся выпуск ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΉ систСмы синтСза Ρ€Π΅Ρ‡ΠΈ RHVoice 1.6.0, ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ Ρ€Π°Π·Π²ΠΈΠ²Π°Π²ΡˆΠ΅ΠΉΡΡ для обСспСчСния качСствСнной ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ русского языка, Π½ΠΎ Π·Π°Ρ‚Π΅ΠΌ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΈ для Π΄Ρ€ΡƒΠ³ΠΈΡ… языков, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ английский, ΠΏΠΎΡ€Ρ‚ΡƒΠ³Π°Π»ΡŒΡΠΊΠΈΠΉ, украинский, киргизский, татарский ΠΈ грузинский. Код написан Π½Π° Π‘++ ΠΈ распространяСтся ΠΏΠΎΠ΄ Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ LGPL 2.1. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ€Π°Π±ΠΎΡ‚Π° Π² GNU/Linux, Windows ΠΈ Android. ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° совмСстима с Ρ‚ΠΈΠΏΠΎΠ²Ρ‹ΠΌΠΈ TTS-интСрфСйсами (text-to-speech) для прСобразования тСкста Π² Ρ€Π΅Ρ‡ΡŒ: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ΠΈ Android Text-To-Speech API, Π½ΠΎ Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² экранном Ρ€ΠΈΠ΄Π΅Ρ€Π΅ NVDA. Π‘ΠΎΠ·Π΄Π°Ρ‚Π΅Π»Π΅ΠΌ ΠΈ основным Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠΌ RHVoice являСтся Ольга Π―ΠΊΠΎΠ²Π»Π΅Π²Π°, которая Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅Ρ‚ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ нСсмотря Π½Π° ΠΏΠΎΠ»Π½ΡƒΡŽ слСпоту.

Π’ Π½ΠΎΠ²ΠΎΠΉ вСрсии Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΎ 5 Π½ΠΎΠ²Ρ‹Ρ… Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² голосов для русской Ρ€Π΅Ρ‡ΠΈ. Π Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° албанского языка. ΠžΠ±Π½ΠΎΠ²Π»Ρ‘Π½ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ для украинского языка. Π Π°ΡΡˆΠΈΡ€Π΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° озвучивания символов emoji. ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° ΠΏΠΎ ΡƒΡΡ‚Ρ€Π°Π½Π΅Π½ΠΈΡŽ ошибок Π² ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ для ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android, ΡƒΠΏΡ€ΠΎΡ‰Ρ‘Π½ ΠΈΠΌΠΏΠΎΡ€Ρ‚ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… словарСй, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android 11. Π’ ядро Π΄Π²ΠΈΠΆΠΊΠ° Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ Π½ΠΎΠ²Ρ‹Π΅ настройки ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ возмоТности, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ g2p.case, word_break ΠΈ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΡƒ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² эквализации.

Напомним, Ρ‡Ρ‚ΠΎ Π² RHVoice ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π½Π°Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° HTS (HMM/DNN-based Speech Synthesis System) ΠΈ парамСтричСский ΠΌΠ΅Ρ‚ΠΎΠ΄ синтСза со статистичСскими модСлями (Statistical Parametric Synthesis Π½Π° Π±Π°Π·Π΅ HMM — Hidden Markov Model). Плюсом статистичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½ΠΈΠ·ΠΊΠΈΠ΅ Π½Π°ΠΊΠ»Π°Π΄Π½Ρ‹Π΅ расходы ΠΈ Π½Π΅Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΊ мощности CPU. ВсС ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ локально Π½Π° систСмС ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚Ρ€ΠΈ уровня качСства Ρ€Π΅Ρ‡ΠΈ (Ρ‡Π΅ΠΌ Π½ΠΈΠΆΠ΅ качСство — Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ мСньшС врСмя Ρ€Π΅Π°ΠΊΡ†ΠΈΠΈ).

ΠœΠΈΠ½ΡƒΡΠΎΠΌ статистичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ являСтся ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½ΠΈΠ·ΠΊΠΎΠ΅ качСство ΠΏΡ€ΠΎΠΈΠ·Π½ΠΎΡˆΠ΅Π½ΠΈΡ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π΅ достигаСт уровня синтСзаторов, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… Ρ€Π΅Ρ‡ΡŒ Π½Π° основС ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚ΠΎΠ² СстСствСнной Ρ€Π΅Ρ‡ΠΈ, Π½ΠΎ Ρ‚Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π²ΠΏΠΎΠ»Π½Π΅ Ρ€Π°Π·Π±ΠΎΡ€Ρ‡ΠΈΠ² ΠΈ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ Ρ‚Ρ€Π°Π½ΡΠ»ΡΡ†ΠΈΡŽ записи с громкоговоритСля. Для сравнСния, ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Silero, ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΉ Π΄Π²ΠΈΠΆΠΎΠΊ для синтСза Ρ€Π΅Ρ‡ΠΈ Π½Π° основС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ машинного обучСния ΠΈ Π½Π°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ для русского языка, ΠΏΠΎ качСству прСвосходит RHVoice.

Для русского языка доступно 13 Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² голосов, для английского — 5. Голоса Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π½Π° основС записСй СстСствСнной Ρ€Π΅Ρ‡ΠΈ. Π’ настройках ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ, высоту ΠΈ Π³Ρ€ΠΎΠΌΠΊΠΎΡΡ‚ΡŒ. Для измСнСния Ρ‚Π΅ΠΌΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° Sonic. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ автоматичСскоС ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ языка Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ тСкста (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, для слов ΠΈ Ρ†ΠΈΡ‚Π°Ρ‚ Π½Π° Π΄Ρ€ΡƒΠ³ΠΎΠΌ языкС ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ родная для Π΄Π°Π½Π½ΠΎΠ³ΠΎ языка модСль синтСза). ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ голосовыС ΠΏΡ€ΠΎΡ„ΠΈΠ»ΠΈ, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠ΅ сочСтания голосов для Ρ€Π°Π·Π½Ρ‹Ρ… языков.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: opennet.ru

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ