A fost lansat sintetizatorul de vorbire RHVoice 1.6.0

A fost lansat sistemul deschis de sinteză a vorbirii RHVoice 1.6.0, dezvoltat inițial pentru a oferi suport de înaltă calitate pentru limba rusă, dar apoi adaptat pentru alte limbi, inclusiv engleză, portugheză, ucraineană, kârgâză, tătară și georgiană. Codul este scris în C++ și distribuit sub licența LGPL 2.1. Acceptă lucrul pe GNU/Linux, Windows și Android. Programul este compatibil cu interfețele standard TTS (text-to-speech) pentru conversia textului în vorbire: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) și Android Text-To-Speech API, dar poate fi folosit și în NVDA cititor de ecran. Creatorul și dezvoltatorul principal al RHVoice este Olga Yakovleva, care dezvoltă proiectul în ciuda faptului că este complet oarbă.

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

Să reamintim că RHVoice folosește dezvoltările proiectului HTS (HMM/DNN-based Speech Synthesis System) și metoda de sinteză parametrică cu modele statistice (Statistical Parametric Synthesis based on HMM - Hidden Markov Model). Avantajul modelului statistic este costurile generale reduse și puterea CPU nepretențioasă. Toate operațiunile sunt efectuate local pe sistemul utilizatorului. Sunt acceptate trei niveluri de calitate a vorbirii (cu cât calitatea este mai scăzută, cu atât performanța este mai mare și timpul de reacție este mai scurt).

Dezavantajul modelului statistic este calitatea relativ scăzută a pronunției, care nu ajunge la nivelul sintetizatoarelor care generează vorbire pe baza unei combinații de fragmente de vorbire naturală, dar cu toate acestea rezultatul este destul de lizibil și seamănă cu difuzarea unei înregistrări dintr-un difuzor. . Pentru comparație, proiectul Silero, care oferă un motor deschis de sinteză a vorbirii bazat pe tehnologii de învățare automată și un set de modele pentru limba rusă, este superioară ca calitate față de RHVoice.

Există 13 opțiuni de voce disponibile pentru limba rusă și 5 pentru engleză. Vocile sunt formate pe baza înregistrărilor de vorbire naturală. În setări puteți modifica viteza, înălțimea și volumul. Biblioteca Sonic poate fi folosită pentru a schimba tempo-ul. Este posibil să detectați și să comutați automat limbile pe baza analizei textului introdus (de exemplu, pentru cuvinte și citate într-o altă limbă, se poate folosi un model de sinteză nativ pentru limba respectivă). Profilurile vocale sunt acceptate, definind combinații de voci pentru diferite limbi.

Sursa: opennet.ru

Adauga un comentariu