RHVoice 1.8.0 nutq sintezatorining chiqarilishi

Ochiq nutq sintezi tizimi RHVoice 1.8.0 chiqarildi, dastlab rus tilini yuqori sifatli qo'llab-quvvatlash uchun ishlab chiqilgan, ammo keyin boshqa tillar, jumladan, ingliz, portugal, ukrain, qirg'iz, tatar va gruzin tillari uchun moslashtirilgan. Kod C++ da yozilgan va LGPL 2.1 litsenziyasi ostida tarqatilgan. GNU/Linux, Windows va Androidda ishlashni qo'llab-quvvatlaydi. Dastur matnni nutqqa aylantirish uchun standart TTS (matnni nutqqa) interfeyslari bilan mos keladi: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) va Android Text-to-Speech API, lekin NVDA da ham foydalanish mumkin. ekran o'quvchi. RHVoice-ning yaratuvchisi va asosiy ishlab chiquvchisi Olga Yakovleva bo'lib, u butunlay ko'r bo'lishiga qaramay loyihani ishlab chiqadi.

Android platformasi uchun 1.8-versiya mobil ilovani yangilamasdan ovozli ma'lumotlar yangilanishlarini yuklab olish imkonini beruvchi yangi ovoz va til ma'lumotlarini boshqarish tizimini taqdim etadi. Qo'shilgan ovozlar va tillar uchun ma'lumotlar yangilanishlari avtomatik ravishda tekshiriladi. Bundan tashqari, yangi nashr polyak tilini qo'llab-quvvatlashni joriy qiladi va makedon tili uchun yangi ovozni qo'shadi. NVDA ekran o'quvchisining so'nggi alfa va beta versiyalari bilan muvofiqligi ta'minlangan. Nutq dispetcheri mavjud bo'lmaganda yuzaga kelgan Linux platformasida qurish bilan bog'liq muammolar tuzatildi.

Eslatib o'tamiz, RHVoice HTS loyihasining ishlanmalaridan (HMM/DNN-ga asoslangan nutqni sintez qilish tizimi) va statistik modellar bilan parametrik sintez usulidan (HMM asosidagi statistik parametrik sintez - Yashirin Markov modeli) foydalanadi. Statistik modelning afzalligi past xarajatlar va oddiy protsessor quvvatidir. Barcha operatsiyalar foydalanuvchi tizimida mahalliy ravishda amalga oshiriladi. Nutq sifatining uchta darajasi qo'llab-quvvatlanadi (sifat qanchalik past bo'lsa, unumdorlik shunchalik yuqori bo'ladi va reaktsiya vaqti qisqaradi).

Statistik modelning salbiy tomoni talaffuzning nisbatan past sifati bo'lib, u tabiiy nutq fragmentlari kombinatsiyasi asosida nutqni yaratadigan sintezatorlar darajasiga etib bormaydi, ammo shunga qaramay, natija juda tushunarli va ovoz kuchaytirgichdan yozuvni uzatishga o'xshaydi. . Taqqoslash uchun, mashinani o'rganish texnologiyalari va rus tili uchun modellar to'plamiga asoslangan ochiq nutq sintezi dvigatelini taqdim etuvchi Silero loyihasi sifat jihatidan RHVoice'dan ustundir.

Rus tili uchun 14 ta, ingliz tili uchun 6 ta ovozli variant mavjud.Ovozlar tabiiy nutq yozuvlari asosida tuzilgan. Sozlamalarda siz tezlikni, balandlikni va ovoz balandligini o'zgartirishingiz mumkin. Tempni o'zgartirish uchun Sonic kutubxonasidan foydalanish mumkin. Kiritilgan matnni tahlil qilish asosida tillarni avtomatik aniqlash va almashtirish mumkin (masalan, boshqa tildagi so'zlar va qo'shtirnoqlar uchun o'sha tilga xos sintez modelidan foydalanish mumkin). Ovozli profillar qo'llab-quvvatlanadi, ular turli tillar uchun ovozlar kombinatsiyasini belgilaydi.

Manba: opennet.ru

a Izoh qo'shish