Utgivning av talsyntes RHVoice 1.2.4, utvecklad för ryska språket

Utgivningen av det öppna talsyntessystemet RHVoice 1.2.4 har publicerats, ursprungligen utvecklat för att ge högkvalitativt stöd för det ryska språket, men sedan anpassat för andra språk, inklusive engelska, portugisiska, ukrainska, kirgiziska, tatariska och georgiska. Koden är skriven i C++ och distribueras under LGPL 2.1-licensen. Stöder arbete på GNU/Linux, Windows och Android. Programmet är kompatibelt med standard TTS (text-till-tal)-gränssnitt för att konvertera text till tal: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) och Android Text-To-Speech API, men kan även användas i NVDA skärmläsare.

Programmet använder den parametriska syntesmetoden med statistiska modeller (Statistical Parametric Synthesis baserat på HMM - Hidden Markov Model). Fördelen med den statistiska modellen är låga omkostnader och kravlös CPU-kraft. Alla operationer utförs lokalt på användarens system. Tre nivåer av talkvalitet stöds (ju lägre kvalitet, desto högre prestanda och desto kortare reaktionstid).

Stöder inställning och ändring av röster. Det finns 9 röstalternativ tillgängliga för det ryska språket och 5 för engelska. Rösterna bildas baserat på inspelningar av naturligt tal. På grund av användningen av en statistisk modell når inte kvaliteten på uttalet nivån för synthesizers som genererar tal baserat på en kombination av fragment av naturligt tal, men resultatet är ändå ganska begripligt och liknar en sändning av en inspelning från en högtalare .

I inställningarna kan du ändra hastighet, tonhöjd och volym. Sonic-biblioteket kan användas för att ändra tempo. Det är möjligt att automatiskt upptäcka och byta språk baserat på analys av inmatningstexten (till exempel för ord och citat på ett annat språk kan en syntesmodell som är inbyggd i det språket användas). Röstprofiler stöds, vilket definierar kombinationer av röster för olika språk.

Källa: opennet.ru

Lägg en kommentar