A fost lansat sintetizatorul de vorbire RHVoice 1.6.0

RHVoice 1.6.0, un sistem de sinteză vocală open-source, a fost lansat. Dezvoltat inițial pentru a oferi suport de înaltă calitate pentru limba rusă, a fost ulterior adaptat pentru alte limbi, inclusiv engleză, portugheză, ucraineană, kirghiză, tătară și georgiană. Codul este scris în C++ și distribuit sub licența LGPL 2.1. De asemenea, este suportat și pentru GNU/Linux.Linux, Windows и AndroidProgramul este compatibil cu interfețele TTS (text-to-speech) tipice pentru convertirea textului în vorbire: SAPI5 (Windows), Dispecer de vorbire (GNU/Linux) Și Android API-ul Text-to-Speech, dar poate fi utilizat și cu cititorul de ecran NVDA. Creatoarea și principala dezvoltatoare a RHVoice este Olga Yakovleva, care continuă să dezvolte proiectul în ciuda faptului că este complet oarbă.

Noua versiune adaugă 5 noi opțiuni vocale pentru vorbirea în limba rusă. A fost implementat suport pentru limba albaneză. Dicționarul ucrainean a fost actualizat. A fost extins suportul pentru pronunția emoji-urilor. Au fost implementate corecții de erori în aplicația platformei. Android, importul dicționarelor utilizatorilor a fost simplificat și a fost adăugat suport pentru platformă Android 11. Au fost adăugate noi setări și funcționalități la nucleul motorului, inclusiv g2p.case, word_break și suport pentru filtre de egalizare.

Să reamintim că RHVoice folosește dezvoltările proiectului HTS (HMM/DNN-based Speech Synthesis System) și metoda de sinteză parametrică cu modele statistice (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Avantajul modelului statistic este costurile generale reduse și puterea CPU nepretențioasă. Toate operațiunile sunt efectuate local pe sistemul utilizatorului. Sunt acceptate trei niveluri de calitate a vorbirii (cu cât calitatea este mai scăzută, cu atât performanța este mai mare și timpul de reacție este mai scurt).

Dezavantajul modelului statistic este calitatea relativ scăzută a pronunției, care nu ajunge la nivelul sintetizatoarelor care generează vorbire pe baza unei combinații de fragmente de vorbire naturală, dar cu toate acestea rezultatul este destul de lizibil și seamănă cu difuzarea unei înregistrări dintr-un difuzor. . Pentru comparație, proiectul Silero, care oferă un motor deschis de sinteză a vorbirii bazat pe tehnologii de învățare automată și un set de modele pentru limba rusă, este superioară ca calitate față de RHVoice.

Există 13 opțiuni de voce disponibile pentru limba rusă și 5 pentru engleză. Vocile sunt formate pe baza înregistrărilor de vorbire naturală. În setări puteți modifica viteza, înălțimea și volumul. Biblioteca Sonic poate fi folosită pentru a schimba tempo-ul. Este posibil să detectați și să comutați automat limbile pe baza analizei textului introdus (de exemplu, pentru cuvinte și citate într-o altă limbă, se poate folosi un model de sinteză nativ pentru limba respectivă). Profilurile vocale sunt acceptate, definind combinații de voci pentru diferite limbi.

Sursa: opennet.ru

Cumpărați găzduire de încredere pentru site-uri cu protecție DDoS, servere VPS VDS 🔥 Cumpără găzduire web fiabilă cu protecție DDoS, servere VPS VDS | ProHoster