RHVoice 1.6.0-eldono de parolsintezilo

RHVoice 1.6.0, malfermfonteca parolsinteza sistemo, estis publikigita. Komence evoluigita por provizi altkvalitan subtenon por la rusa, ĝi poste estis adaptita por aliaj lingvoj, inkluzive de la angla, portugala, ukraina, kirgiza, tatara kaj kartvela. La kodo estas skribita en C++ kaj distribuita sub la permesilo LGPL 2.1. GNU/Linuksa subteno ankaŭ estas subtenata.Linux, Windows и AndroidLa programo kongruas kun tipaj TTS (teksto-al-parolo) interfacoj por konverti tekston al parolado: SAPI5 (Windows), Parola Dissendanto (GNU/Linux) kaj Android Teksto-al-Parolado API, sed ankaŭ uzebla kun la ekranlegilo NVDA. La kreinto kaj ĉefa programisto de RHVoice estas Olga Yakovleva, kiu daŭre disvolvas la projekton malgraŭ esti tute blinda.

La nova versio aldonas 5 novajn voĉajn opciojn por rusa parolado. Subteno por la albana lingvo estis efektivigita. La ukraina vortaro estis ĝisdatigita. Subteno por la prononco de emoji-oj estis plivastigita. Cimo-korektoj estis efektivigitaj en la platforma aplikaĵo. Android, la importado de uzantovortaroj estis simpligita, kaj platforma subteno estis aldonita Android 11. Novaj agordoj kaj funkcioj estis aldonitaj al la kerno de la motoro, inkluzive de g2p.case, word_break, kaj subteno por egaligaj filtriloj.

Ni rememoru, ke RHVoice uzas la evoluojn de la HTS-projekto (HMM/DNN-bazita Speech Synthesis System) kaj la parametrikan sintezmetodon kun statistikaj modeloj (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). La avantaĝo de la statistika modelo estas malaltaj superkostoj kaj nepostulema CPU-potenco. Ĉiuj operacioj estas faritaj loke sur la sistemo de la uzanto. Tri niveloj de parolkvalito estas subtenataj (ju pli malalta la kvalito, des pli alta la agado kaj des pli mallonga la reagtempo).

La malavantaĝo de la statistika modelo estas la relative malalta kvalito de prononco, kiu ne atingas la nivelon de sinteziloj, kiuj generas parolon surbaze de kombinaĵo de fragmentoj de natura parolo, sed tamen la rezulto estas sufiĉe legebla kaj similas al elsendado de registrado de laŭtparolilo. . Por komparo, la projekto Silero, kiu disponigas malferman parolsintezan motoron bazitan sur maŝinlernado-teknologioj kaj aro da modeloj por la rusa lingvo, estas pli alta en kvalito ol RHVoice.

Estas 13 voĉebloj disponeblaj por la rusa lingvo, kaj por la angla 5. La voĉoj estas formitaj surbaze de registradoj de natura parolado. En la agordoj vi povas ŝanĝi la rapidecon, tonalton kaj volumon. La Sonic-biblioteko povas esti uzata por ŝanĝi la takton. Eblas aŭtomate detekti kaj ŝanĝi lingvojn surbaze de analizo de la eniga teksto (ekzemple, por vortoj kaj citaĵoj en alia lingvo, sinteza modelo denaska de tiu lingvo povas esti uzata). Voĉaj profiloj estas subtenataj, difinante kombinaĵojn de voĉoj por malsamaj lingvoj.

fonto: opennet.ru

Aĉetu fidindan gastigadon por retejoj kun DDoS-protekto, VPS-VDS-serviloj 🔥 Aĉetu fidindan retejan gastigadon kun DDoS-protekto, VPS VDS-servilojn | ProHoster