RHVoice 1.8.0 nitq sintezatoru buraxılışı

Açıq nitq sintezi sistemi RHVoice 1.8.0 buraxıldı, əvvəlcə rus dilini yüksək keyfiyyətli dəstəkləmək üçün hazırlanmış, lakin sonra ingilis, portuqal, ukrayna, qırğız, tatar və gürcü dilləri də daxil olmaqla digər dillərə uyğunlaşdırılmışdır. Kod C++ dilində yazılmışdır və LGPL 2.1 lisenziyası altında paylanmışdır. GNU/Linux, Windows və Android-də işi dəstəkləyir. Proqram mətni nitqə çevirmək üçün standart TTS (text-to-speech) interfeysləri ilə uyğun gəlir: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) və Android Text-to-Speech API, lakin NVDA-da da istifadə oluna bilər. ekran oxuyucusu. RHVoice-nin yaradıcısı və əsas tərtibatçısı tamamilə kor olmasına baxmayaraq layihəni inkişaf etdirən Olqa Yakovlevadır.

Android platforması üçün 1.8 versiyası mobil tətbiqi yeniləmədən səs məlumatı yeniləmələrini yükləməyə imkan verən yeni səs və dil məlumatlarının idarə edilməsi sistemini təqdim edir. Əlavə edilmiş səslər və dillər üçün məlumat yeniləmələri avtomatik yoxlanılır. Bundan əlavə, yeni buraxılış Polyak dili üçün dəstəyi təqdim edir və Makedoniya dili üçün yeni səs əlavə edir. NVDA ekran oxuyucusunun ən son alfa və beta buraxılışları ilə uyğunluq təmin edilir. Nitq Dispetçerinin olmadığı zaman yaranan Linux platformasında tikinti ilə bağlı problemlər aradan qaldırıldı.

Xatırladaq ki, RHVoice HTS layihəsinin inkişaflarından (HMM/DNN əsaslı Nitq Sintez Sistemi) və statistik modellərlə parametrik sintez metodundan (HMM əsasında Statistical Parametric Synthesis – Hidden Markov Model) istifadə edir. Statistik modelin üstünlüyü aşağı əlavə xərclər və tələb olunmayan CPU gücüdür. Bütün əməliyyatlar istifadəçinin sistemində lokal olaraq həyata keçirilir. Nitq keyfiyyətinin üç səviyyəsi dəstəklənir (keyfiyyət nə qədər aşağı olarsa, performans da bir o qədər yüksək olar və reaksiya müddəti bir o qədər qısa olar).

Statistik modelin mənfi tərəfi təbii nitqin fraqmentlərinin birləşməsinə əsaslanaraq nitq yaradan sintezatorların səviyyəsinə çatmayan tələffüzün nisbətən aşağı keyfiyyətidir, lakin buna baxmayaraq, nəticə olduqca oxunaqlıdır və səs ucaldandan səs yazısının yayımına bənzəyir. . Müqayisə üçün qeyd edək ki, maşın öyrənmə texnologiyalarına əsaslanan açıq nitq sintezi mühərriki və rus dili üçün bir sıra modellər təqdim edən Silero layihəsi keyfiyyət baxımından RHVoice-dən üstündür.

Rus dili üçün 14, ingilis dili üçün isə 6 səs variantı mövcuddur.Səslər təbii nitqin yazıları əsasında formalaşır. Parametrlərdə sürəti, səsi və səsi dəyişə bilərsiniz. Sonic kitabxana tempi dəyişdirmək üçün istifadə edilə bilər. Daxil edilən mətnin təhlili əsasında dilləri avtomatik aşkar etmək və dəyişdirmək mümkündür (məsələn, başqa dildəki sözlər və sitatlar üçün həmin dilə məxsus sintez modelindən istifadə edilə bilər). Müxtəlif dillər üçün səs birləşmələrini təyin edən səs profilləri dəstəklənir.

Mənbə: opennet.ru

Добавить комментарий