Випуск синтезатора мови RHVoice 1.2.4, що розвивається для російської мови

Опубліковано випуск відкритої системи синтезу мови RHVoice 1.2.4, що спочатку розвивалася для забезпечення якісної підтримки російської мови, але потім адаптованою і для інших мов, включаючи англійську, португальську, українську, киргизьку, татарську та грузинську. Код написаний С++ і поширюється під ліцензією LGPL 2.1. Підтримується робота в GNU/Linux, Windows та Android. Програма сумісна з типовими TTS-інтерфейсами (text-to-speech) для перетворення тексту на мову: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) та Android Text-To-Speech API, але також може використовуватися в екранному рідері NVDA.

У програмі застосовується параметричний метод синтезу зі статистичними моделями (Statistical Parametric Synthesis з урахуванням HMM — Hidden Markov Model). Плюсом статистичної моделі є низькі накладні витрати та невибагливість до потужності CPU. Усі операції виконуються локально в системі користувача. Підтримується три рівні якості промови (що нижча якість — то вища продуктивність і менше час реакції).

Підтримується налаштування та зміна голосів. Для російської доступно 9 варіантів голосів, для англійської — 5. Голоси формуються з урахуванням записів природної промови. Через використання статистичної моделі якість вимови не досягає рівня синтезаторів, що генерують мову на основі комбінації фрагментів природного мовлення, проте результат цілком розбірливий і нагадує трансляцію запису з гучномовця.

У налаштуваннях можна змінювати швидкість, висоту та гучність. Для зміни темпу може застосовуватись бібліотека Sonic. Можливе автоматичне визначення та перемикання мови на основі аналізу вхідного тексту (наприклад, для слів та цитат іншою мовою може використовуватися рідна для цієї мови модель синтезу). Підтримуються голосові профілі, які визначають поєднання голосів для різних мов.

Джерело: opennet.ru

Додати коментар або відгук