RHVoice 1.8.0 spraaksynthesizer release

It iepen spraaksyntezesysteem RHVoice 1.8.0 waard útbrocht, ynearsten ûntwikkele om heechweardige stipe foar de Russyske taal te leverjen, mar doe oanpast foar oare talen, ynklusyf Ingelsk, Portugeesk, Oekraynsk, Kirgizysk, Tatarysk en Georgysk. De koade is skreaun yn C++ en ferspraat ûnder de LGPL 2.1-lisinsje. Unterstützt wurk op GNU/Linux, Windows en Android. It programma is kompatibel mei standert TTS (tekst-nei-spraak) ynterfaces foar it konvertearjen fan tekst nei spraak: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) en Android Text-To-Speech API, mar kin ek brûkt wurde yn de NVDA skerm lêzer. De skepper en haadûntwikkelder fan RHVoice is Olga Yakovleva, dy't it projekt ûntwikkelet nettsjinsteande folslein blyn.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Lit ús ûnthâlde dat RHVoice de ûntwikkelingen brûkt fan it HTS-projekt (HMM / DNN-basearre Speech Synthesis System) en de parametryske syntezemetoade mei statistyske modellen (Statistical Parametric Synthesis basearre op HMM - Hidden Markov Model). It foardiel fan it statistyske model is lege overhead kosten en undemanding CPU macht. Alle operaasjes wurde lokaal útfierd op it systeem fan de brûker. Trije nivo's fan spraakkwaliteit wurde stipe (hoe leger de kwaliteit, hoe heger de prestaasjes en hoe koarter de reaksjetiid).

It neidiel fan it statistyske model is de relatyf lege kwaliteit fan útspraak, dy't net it nivo berikt fan synthesizers dy't spraak generearje op basis fan in kombinaasje fan fragminten fan natuerlike spraak, mar dochs is it resultaat frij lêsber en liket op it útstjoeren fan in opname fan in luidspreker . Foar fergeliking is it Silero-projekt, dat in iepen spraaksyntezemotor leveret op basis fan masineleartechnologyen en in set modellen foar de Russyske taal, superieur yn kwaliteit foar RHVoice.

D'r binne 14 stimopsjes beskikber foar de Russyske taal, en 6 foar it Ingelsk. De stimmen wurde foarme op basis fan opnames fan natuerlike spraak. Yn 'e ynstellings kinne jo de snelheid, toanhichte en folume feroarje. De Sonic-bibleteek kin brûkt wurde om it tempo te feroarjen. It is mooglik om talen automatysk te detektearjen en te wikseljen op basis fan analyze fan 'e ynfiertekst (bygelyks foar wurden en sitaten yn in oare taal kin in syntezemodel dat lânseigen is foar dy taal brûkt wurde). Stimprofilen wurde stipe, en definiearje kombinaasjes fan stimmen foar ferskate talen.

Boarne: opennet.ru

Add a comment