Derxistina sentezkera axaftinê RHVoice 1.2.4, ku ji bo zimanê rûsî hatî pêşve xistin

Опубликован выпуск открытой системы синтеза речи RHVoice 1.2.4, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA.

В программе применяется параметрический метод синтеза со статистическими моделями (Statistical Parametric Synthesis на базе HMM — Hidden Markov Model). Плюсом статистической модели являются низкие накладные расходы и нетребовательность к мощности CPU. Все операции выполняются локально на системе пользователя. Поддерживается три уровня качества речи (чем ниже качество — тем выше производительность и меньше время реакции).

Поддерживается настройка и смена голосов. Для русского языка доступно 9 вариантов голосов, для английского — 5. Голоса формируются на основе записей естественной речи. Из-за использования статистической модели качество произношения не достигает уровня синтезаторов, генерирующих речь на основе комбинации фрагментов естественной речи, но тем не менее результат вполне разборчив и напоминает трансляцию записи с громкоговорителя.

В настройках можно изменять скорость, высоту и громкость. Для изменения темпа может применяться библиотека Sonic. Возможно автоматическое определение и переключение языка на основе анализа входного текста (например, для слов и цитат на другом языке может использоваться родная для данного языка модель синтеза). Поддерживаются голосовые профили, определяющие сочетания голосов для разных языков.

Source: opennet.ru

Add a comment