Uitgave van spraaksynthesizer RHVoice 1.2.4, ontwikkeld voor de Russische taal

De release van het open spraaksynthesesysteem RHVoice 1.2.4 is gepubliceerd, aanvankelijk ontwikkeld om hoogwaardige ondersteuning te bieden voor de Russische taal, maar vervolgens aangepast voor andere talen, waaronder Engels, Portugees, Oekraïens, Kirgizisch, Tataars en Georgisch. De code is geschreven in C++ en wordt gedistribueerd onder de LGPL 2.1-licentie. Ondersteunt werk op GNU/Linux, Windows en Android. Het programma is compatibel met standaard TTS (text-to-speech) interfaces voor het omzetten van tekst naar spraak: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) en Android Text-To-Speech API, maar kan ook gebruikt worden in de NVDA schermlezer.

Het programma maakt gebruik van de parametrische synthesemethode met statistische modellen (Statistische Parametrische Synthese gebaseerd op HMM - Hidden Markov Model). Het voordeel van het statistische model zijn de lage overheadkosten en het weinig veeleisende CPU-vermogen. Alle bewerkingen worden lokaal op het systeem van de gebruiker uitgevoerd. Er worden drie niveaus van spraakkwaliteit ondersteund (hoe lager de kwaliteit, hoe hoger de prestaties en hoe korter de reactietijd).

Ondersteunt het instellen en veranderen van stemmen. Er zijn 9 stemopties beschikbaar voor de Russische taal en 5 voor het Engels. De stemmen worden gevormd op basis van opnames van natuurlijke spraak. Door het gebruik van een statistisch model bereikt de kwaliteit van de uitspraak niet het niveau van synthesizers die spraak genereren op basis van een combinatie van fragmenten van natuurlijke spraak, maar toch is het resultaat behoorlijk verstaanbaar en lijkt het op een uitzending van een opname uit een luidspreker .

In de instellingen kun je de snelheid, toonhoogte en het volume wijzigen. De Sonic-bibliotheek kan worden gebruikt om het tempo te wijzigen. Het is mogelijk om automatisch talen te detecteren en te schakelen op basis van analyse van de invoertekst (voor woorden en citaten in een andere taal kan bijvoorbeeld een synthesemodel worden gebruikt dat eigen is aan die taal). Er worden stemprofielen ondersteund, die combinaties van stemmen voor verschillende talen definiëren.

Bron: opennet.ru

Voeg een reactie