RHVoice 1.8.0 сөйлеу синтезаторының шығарылымы

RHVoice 1.8.0 ашық сөйлеу синтезі жүйесі шығарылды, ол бастапқыда орыс тілін жоғары сапалы қолдау үшін әзірленген, бірақ кейін басқа тілдерге, соның ішінде ағылшын, португал, украин, қырғыз, татар және грузин тілдеріне бейімделген. Код C++ тілінде жазылған және LGPL 2.1 лицензиясы бойынша таратылады. GNU/Linux, Windows және Android жүйелерінде жұмысты қолдайды. Бағдарлама мәтінді сөйлеуге түрлендіруге арналған стандартты TTS (мәтінді сөйлеуге) интерфейстерімен үйлесімді: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) және Android Text-to-Speech API, бірақ оны NVDA жүйесінде де пайдалануға болады. экранды оқу құралы. RHVoice-тың жасаушысы және негізгі әзірлеушісі - Ольга Яковлева, ол мүлдем соқыр болғанына қарамастан жобаны әзірлейді.

Android платформасына арналған 1.8 нұсқасы мобильді қосымшаны жаңартпай дауыс деректерінің жаңартуларын жүктеп алуға мүмкіндік беретін жаңа дауыс және тіл деректерін басқару жүйесін ұсынады. Қосылған дауыстар мен тілдерге арналған деректер жаңартулары автоматты түрде тексеріледі. Сонымен қатар, жаңа шығарылым поляк тілін қолдауды енгізеді және македон тіліне жаңа дауыс қосады. NVDA экрандық оқу құралының соңғы альфа және бета шығарылымдарымен үйлесімділік қамтамасыз етілген. Сөйлеу диспетчері болмаған кезде пайда болған Linux платформасында құрылысқа қатысты ақаулар түзетілді.

Еске салайық, RHVoice HTS жобасының әзірлемелерін (HMM/DNN негізіндегі Speech Synthesis System) және статистикалық модельдермен параметрлік синтез әдісін (HMM негізіндегі статистикалық параметрлік синтез – Жасырын Марков үлгісі) пайдаланады. Статистикалық модельдің артықшылығы - төмен үстеме шығындар және талап етілмейтін процессорлық қуат. Барлық әрекеттер пайдаланушының жүйесінде жергілікті орындалады. Сөйлеу сапасының үш деңгейіне қолдау көрсетіледі (сапа неғұрлым төмен болса, өнімділік соғұрлым жоғары және реакция уақыты қысқарады).

Статистикалық модельдің кемшілігі - айтылымның салыстырмалы түрде төмен сапасы, ол табиғи сөйлеу фрагменттерінің комбинациясы негізінде сөйлеуді тудыратын синтезаторлар деңгейіне жете алмайды, бірақ соған қарамастан нәтиже анық және дыбыс зорайтқыштан жазбаны таратуға ұқсайды. . Салыстыру үшін, машиналық оқыту технологиялары мен орыс тіліне арналған үлгілер жиынтығы негізінде ашық сөйлеуді синтездеу қозғалтқышын ұсынатын Silero жобасы RHVoice-тен сапа жағынан жоғары.

Орыс тілі үшін 14 дауыс опциясы, ал ағылшын тілі үшін 6 дауыс опциясы бар.Дауыстар табиғи сөйлеудің жазбаларына негізделген. Параметрлерде жылдамдықты, дыбыс биіктігін және дыбыс деңгейін өзгертуге болады. Sonic кітапханасын қарқынды өзгерту үшін пайдалануға болады. Енгізілген мәтінді талдау негізінде тілдерді автоматты түрде анықтауға және ауыстыруға болады (мысалы, басқа тілдегі сөздер мен тырнақшалар үшін сол тілге тән синтез үлгісін пайдалануға болады). Әртүрлі тілдер үшін дауыс комбинацияларын анықтайтын дауыс профильдеріне қолдау көрсетіледі.

Ақпарат көзі: opennet.ru

пікір қалдыру