RHVoice 1.6.0 сөйлеу синтезаторының шығарылымы

RHVoice 1.6.0 ашық сөйлеу синтезі жүйесі шығарылды, ол бастапқыда орыс тілін жоғары сапалы қолдау үшін әзірленген, бірақ кейін басқа тілдерге, соның ішінде ағылшын, португал, украин, қырғыз, татар және грузин тілдеріне бейімделген. Код C++ тілінде жазылған және LGPL 2.1 лицензиясы бойынша таратылады. GNU/Linux, Windows және Android жүйелерінде жұмысты қолдайды. Бағдарлама мәтінді сөйлеуге түрлендіруге арналған стандартты TTS (мәтінді сөйлеуге) интерфейстерімен үйлесімді: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) және Android Text-to-Speech API, бірақ оны NVDA жүйесінде де пайдалануға болады. экранды оқу құралы. RHVoice-тың жасаушысы және негізгі әзірлеушісі - Ольга Яковлева, ол мүлдем соқыр болғанына қарамастан жобаны әзірлейді.

Жаңа нұсқа орыс тілінде сөйлеу үшін 5 жаңа дауыс опциясын қосады. Албан тілін қолдау жүзеге асырылды. Украин тілінің сөздігі жаңартылды. Эмодзи кейіпкерлерінің дауыстық әрекетін қолдау кеңейтілді. Android платформасына арналған қосымшадағы қателерді жою бойынша жұмыс жүргізілді, пайдаланушы сөздіктерді импорттау жеңілдетілді, Android 11 платформасына қолдау қосылды.Қозғалтқыштың өзегіне жаңа параметрлер мен функционалдылық қосылды, соның ішінде g2p. case, word_break және теңестіру сүзгілеріне қолдау көрсету.

Еске салайық, RHVoice HTS жобасының әзірлемелерін (HMM/DNN негізіндегі Speech Synthesis System) және статистикалық модельдермен параметрлік синтез әдісін (HMM негізіндегі статистикалық параметрлік синтез – Жасырын Марков үлгісі) пайдаланады. Статистикалық модельдің артықшылығы - төмен үстеме шығындар және талап етілмейтін процессорлық қуат. Барлық әрекеттер пайдаланушының жүйесінде жергілікті орындалады. Сөйлеу сапасының үш деңгейіне қолдау көрсетіледі (сапа неғұрлым төмен болса, өнімділік соғұрлым жоғары және реакция уақыты қысқарады).

Статистикалық модельдің кемшілігі - айтылымның салыстырмалы түрде төмен сапасы, ол табиғи сөйлеу фрагменттерінің комбинациясы негізінде сөйлеуді тудыратын синтезаторлар деңгейіне жете алмайды, бірақ соған қарамастан нәтиже анық және дыбыс зорайтқыштан жазбаны таратуға ұқсайды. . Салыстыру үшін, машиналық оқыту технологиялары мен орыс тіліне арналған үлгілер жиынтығы негізінде ашық сөйлеуді синтездеу қозғалтқышын ұсынатын Silero жобасы RHVoice-тен сапа жағынан жоғары.

Орыс тілі үшін 13 дауыс опциясы, ал ағылшын тілі үшін 5 дауыс опциясы бар.Дауыстар табиғи сөйлеудің жазбаларына негізделген. Параметрлерде жылдамдықты, дыбыс биіктігін және дыбыс деңгейін өзгертуге болады. Sonic кітапханасын қарқынды өзгерту үшін пайдалануға болады. Енгізілген мәтінді талдау негізінде тілдерді автоматты түрде анықтауға және ауыстыруға болады (мысалы, басқа тілдегі сөздер мен тырнақшалар үшін сол тілге тән синтез үлгісін пайдалануға болады). Әртүрлі тілдер үшін дауыс комбинацияларын анықтайтын дауыс профильдеріне қолдау көрсетіледі.

Ақпарат көзі: opennet.ru

пікір қалдыру