RHVoice 1.6.0 nitq sintezatoru buraxılışı

Açıq nitq sintezi sistemi RHVoice 1.6.0 buraxıldı, əvvəlcə rus dilini yüksək keyfiyyətli dəstəkləmək üçün hazırlanmış, lakin sonra ingilis, portuqal, ukrayna, qırğız, tatar və gürcü dilləri də daxil olmaqla digər dillərə uyğunlaşdırılmışdır. Kod C++ dilində yazılmışdır və LGPL 2.1 lisenziyası altında paylanmışdır. GNU/Linux, Windows və Android-də işi dəstəkləyir. Proqram mətni nitqə çevirmək üçün standart TTS (text-to-speech) interfeysləri ilə uyğun gəlir: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) və Android Text-to-Speech API, lakin NVDA-da da istifadə oluna bilər. ekran oxuyucusu. RHVoice-nin yaradıcısı və əsas tərtibatçısı tamamilə kor olmasına baxmayaraq layihəni inkişaf etdirən Olqa Yakovlevadır.

Yeni versiyaya rus dilində nitq üçün 5 yeni səs seçimi əlavə olunur. Alban dili dəstəyi həyata keçirilib. Ukrayna dili üçün lüğət yeniləndi. Emoji simvollarının səsli fəaliyyətinə dəstək genişləndirildi. Android platforması üçün tətbiqdə səhvlərin aradan qaldırılması üçün işlər görülüb, fərdi lüğətlərin idxalı sadələşdirilib, Android 11 platformasına dəstək əlavə edilib.Mühərrikin nüvəsinə, o cümlədən g2p-ə yeni parametrlər və funksionallıq əlavə edilib. case, word_break və bərabərləşdirmə filtrləri üçün dəstək.

Xatırladaq ki, RHVoice HTS layihəsinin inkişaflarından (HMM/DNN əsaslı Nitq Sintez Sistemi) və statistik modellərlə parametrik sintez metodundan (HMM əsasında Statistical Parametric Synthesis – Hidden Markov Model) istifadə edir. Statistik modelin üstünlüyü aşağı əlavə xərclər və tələb olunmayan CPU gücüdür. Bütün əməliyyatlar istifadəçinin sistemində lokal olaraq həyata keçirilir. Nitq keyfiyyətinin üç səviyyəsi dəstəklənir (keyfiyyət nə qədər aşağı olarsa, performans da bir o qədər yüksək olar və reaksiya müddəti bir o qədər qısa olar).

Statistik modelin mənfi tərəfi təbii nitqin fraqmentlərinin birləşməsinə əsaslanaraq nitq yaradan sintezatorların səviyyəsinə çatmayan tələffüzün nisbətən aşağı keyfiyyətidir, lakin buna baxmayaraq, nəticə olduqca oxunaqlıdır və səs ucaldandan səs yazısının yayımına bənzəyir. . Müqayisə üçün qeyd edək ki, maşın öyrənmə texnologiyalarına əsaslanan açıq nitq sintezi mühərriki və rus dili üçün bir sıra modellər təqdim edən Silero layihəsi keyfiyyət baxımından RHVoice-dən üstündür.

Rus dili üçün 13, ingilis dili üçün isə 5 səs variantı mövcuddur.Səslər təbii nitqin yazıları əsasında formalaşır. Parametrlərdə sürəti, səsi və səsi dəyişə bilərsiniz. Sonic kitabxana tempi dəyişdirmək üçün istifadə edilə bilər. Daxil edilən mətnin təhlili əsasında dilləri avtomatik aşkar etmək və dəyişdirmək mümkündür (məsələn, başqa dildəki sözlər və sitatlar üçün həmin dilə məxsus sintez modelindən istifadə edilə bilər). Müxtəlif dillər üçün səs birləşmələrini təyin edən səs profilləri dəstəklənir.

Mənbə: opennet.ru

Добавить комментарий