RHVoice 1.8.0 spraaksintetiseerder vrystelling

Die oopbron-spraaksintesestelsel RHVoice 1.8.0 is vrygestel, aanvanklik ontwikkel om hoëgehalte-ondersteuning vir die Russiese taal te bied, maar toe aangepas vir ander tale, insluitend Engels, Portugees, Oekraïens, Kirgisies, Tataars en Georgies. Die kode is in C++ geskryf en onder die LGPL 2.1-lisensie versprei. Werk word ondersteun in GNU/Linux, Windows en Android. Die program is versoenbaar met tipiese TTS (teks-na-spraak)-koppelvlakke vir teks-na-spraak: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) en Android Text-to-Speech API, maar kan ook gebruik word in die NVDA skermleser. Die skepper en hoofontwikkelaar van RHVoice is Olga Yakovleva, wat die projek ontwikkel ten spyte daarvan dat sy heeltemal blind is.

Weergawe 1.8 vir die Android-platform stel 'n nuwe stem- en taaldatabestuurstelsel bekend wat jou toelaat om stemdata-opdaterings af te laai sonder om die mobiele toepassing op te dateer. Kyk vir data-opdaterings vir bygevoegde stemme en tale word outomaties gedoen. Daarbenewens stel die nuwe vrystelling ondersteuning vir die Poolse taal bekend en voeg 'n nuwe stem vir die Masedoniese taal by. Verseker verenigbaarheid met onlangse alfa- en beta-vrystellings van die NVDA-skermleser. Vaste Linux-bouprobleme wat plaasgevind het toe die Spraakverspreider nie teenwoordig was nie.

Onthou dat RHVoice die ontwikkelings van die HTS-projek (HMM / DNN-gebaseerde Spraaksintesestelsel) en die parametriese sintesemetode met statistiese modelle (Statistical Parametric Synthesis gebaseer op HMM - Hidden Markov Model) gebruik. Die voordeel van die statistiese model is lae bokoste en veeleisende SVE-krag. Alle bewerkings word plaaslik op die gebruiker se stelsel uitgevoer. Drie vlakke van spraakkwaliteit word ondersteun (hoe laer die kwaliteit, hoe hoër die werkverrigting en hoe korter die reaksietyd).

Die nadeel van die statistiese model is die relatief lae kwaliteit van uitspraak, wat nie die vlak bereik van sintetiseerders wat spraak genereer gebaseer op 'n kombinasie van fragmente van natuurlike spraak nie, maar nietemin is die resultaat redelik leesbaar en lyk soos 'n uitsaaiopname vanaf 'n luidspreker . In vergelyking, die Silero-projek, wat 'n oop enjin bied vir spraaksintese gebaseer op masjienleertegnologieë en 'n stel modelle vir die Russiese taal, oortref RHVoice in kwaliteit.

Vir die Russiese taal is 14 stemopsies beskikbaar, vir Engels - 6. Stemme word gevorm op grond van natuurlike spraakopnames. In die instellings kan jy die spoed, toonhoogte en volume verander. Die Sonic-biblioteek kan gebruik word om die tempo te verander. Dit is moontlik om die taal outomaties op te spoor en te verander op grond van die ontleding van die invoerteks (byvoorbeeld, vir woorde en aanhalings in 'n ander taal, kan 'n inheemse sintesemodel vir hierdie taal gebruik word). Stemprofiele word ondersteun wat kombinasies van stemme vir verskillende tale definieer.

Bron: opennet.ru

Voeg 'n opmerking