RHVoice 1.6.0 spraaksintetiseerder vrystelling

RHVoice 1.6.0, 'n oopbron-spraaksintesestelsel, is vrygestel. Aanvanklik ontwikkel om hoëgehalte-ondersteuning vir Russies te bied, is dit sedertdien aangepas vir ander tale, insluitend Engels, Portugees, Oekraïens, Kirgisies, Tataars en Georgies. Die kode is in C++ geskryf en versprei onder die LGPL 2.1-lisensie. GNU/Linux-ondersteuning word ook ondersteun.Linux, Windows и AndroidDie program is versoenbaar met tipiese TTS (teks-na-spraak) koppelvlakke vir die omskakeling van teks na spraak: SAPI5 (Windows), Spraakverspreider (GNU/Linux) En Android Teks-na-spraak API, maar kan ook saam met die NVDA-skermleser gebruik word. Die skepper en hoofontwikkelaar van RHVoice is Olga Yakovleva, wat die projek steeds ontwikkel ten spyte daarvan dat sy heeltemal blind is.

Die nuwe weergawe voeg 5 nuwe stemopsies vir Russiese spraak by. Albanese taalondersteuning is geïmplementeer. Die Oekraïense woordeboek is opgedateer. Ondersteuning vir emoji-uitspraak is uitgebrei. Foutoplossings is in die platform-app geïmplementeer. Android, die invoer van gebruikerswoordeboeke is vereenvoudig, en platformondersteuning is bygevoeg Android 11. Nuwe instellings en funksionaliteit is by die enjinkern gevoeg, insluitend g2p.case, word_break, en ondersteuning vir gelykmakingsfilters.

Onthou dat RHVoice die ontwikkelings van die HTS-projek (HMM / DNN-gebaseerde Spraaksintesestelsel) en die parametriese sintesemetode met statistiese modelle (Statistical Parametric Synthesis gebaseer op HMM - Hidden Markov Model) gebruik. Die voordeel van die statistiese model is lae bokoste en veeleisende SVE-krag. Alle bewerkings word plaaslik op die gebruiker se stelsel uitgevoer. Drie vlakke van spraakkwaliteit word ondersteun (hoe laer die kwaliteit, hoe hoër die werkverrigting en hoe korter die reaksietyd).

Die nadeel van die statistiese model is die relatief lae kwaliteit van uitspraak, wat nie die vlak bereik van sintetiseerders wat spraak genereer gebaseer op 'n kombinasie van fragmente van natuurlike spraak nie, maar nietemin is die resultaat redelik leesbaar en lyk soos 'n uitsaaiopname vanaf 'n luidspreker . In vergelyking, die Silero-projek, wat 'n oop enjin bied vir spraaksintese gebaseer op masjienleertegnologieë en 'n stel modelle vir die Russiese taal, oortref RHVoice in kwaliteit.

Vir die Russiese taal is 13 stemopsies beskikbaar, vir Engels - 5. Stemme word gevorm op grond van natuurlike spraakopnames. In die instellings kan jy die spoed, toonhoogte en volume verander. Die Sonic-biblioteek kan gebruik word om die tempo te verander. Dit is moontlik om die taal outomaties op te spoor en te verander op grond van die ontleding van die invoerteks (byvoorbeeld, vir woorde en aanhalings in 'n ander taal, kan 'n inheemse sintesemodel vir hierdie taal gebruik word). Stemprofiele word ondersteun wat kombinasies van stemme vir verskillende tale definieer.

Bron: opennet.ru

Koop betroubare hosting vir werwe met DDoS-beskerming, VPS VDS-bedieners 🔥 Koop betroubare webwerfhosting met DDoS-beskerming, VPS VDS-bedieners | ProHoster