RHVoice 1.6.0 nutq sintezatorining chiqarilishi

Ochiq nutq sintezi tizimi RHVoice 1.6.0 chiqarildi, dastlab rus tilini yuqori sifatli qo'llab-quvvatlash uchun ishlab chiqilgan, ammo keyin boshqa tillar, jumladan, ingliz, portugal, ukrain, qirg'iz, tatar va gruzin tillari uchun moslashtirilgan. Kod C++ da yozilgan va LGPL 2.1 litsenziyasi ostida tarqatilgan. GNU/Linux, Windows va Androidda ishlashni qo'llab-quvvatlaydi. Dastur matnni nutqqa aylantirish uchun standart TTS (matnni nutqqa) interfeyslari bilan mos keladi: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) va Android Text-to-Speech API, lekin NVDA da ham foydalanish mumkin. ekran o'quvchi. RHVoice-ning yaratuvchisi va asosiy ishlab chiquvchisi Olga Yakovleva bo'lib, u butunlay ko'r bo'lishiga qaramay loyihani ishlab chiqadi.

Π’ Π½ΠΎΠ²ΠΎΠΉ вСрсии Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΎ 5 Π½ΠΎΠ²Ρ‹Ρ… Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² голосов для русской Ρ€Π΅Ρ‡ΠΈ. Π Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° албанского языка. ΠžΠ±Π½ΠΎΠ²Π»Ρ‘Π½ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ для украинского языка. Π Π°ΡΡˆΠΈΡ€Π΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° озвучивания символов emoji. ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° ΠΏΠΎ ΡƒΡΡ‚Ρ€Π°Π½Π΅Π½ΠΈΡŽ ошибок Π² ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ для ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android, ΡƒΠΏΡ€ΠΎΡ‰Ρ‘Π½ ΠΈΠΌΠΏΠΎΡ€Ρ‚ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… словарСй, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹ Android 11. Π’ ядро Π΄Π²ΠΈΠΆΠΊΠ° Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ Π½ΠΎΠ²Ρ‹Π΅ настройки ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ возмоТности, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ g2p.case, word_break ΠΈ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΡƒ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² эквализации.

Eslatib o'tamiz, RHVoice HTS loyihasining ishlanmalaridan (HMM/DNN-ga asoslangan nutqni sintez qilish tizimi) va statistik modellar bilan parametrik sintez usulidan (HMM asosidagi statistik parametrik sintez - Yashirin Markov modeli) foydalanadi. Statistik modelning afzalligi past xarajatlar va oddiy protsessor quvvatidir. Barcha operatsiyalar foydalanuvchi tizimida mahalliy ravishda amalga oshiriladi. Nutq sifatining uchta darajasi qo'llab-quvvatlanadi (sifat qanchalik past bo'lsa, unumdorlik shunchalik yuqori bo'ladi va reaktsiya vaqti qisqaradi).

Statistik modelning salbiy tomoni talaffuzning nisbatan past sifati bo'lib, u tabiiy nutq fragmentlari kombinatsiyasi asosida nutqni yaratadigan sintezatorlar darajasiga etib bormaydi, ammo shunga qaramay, natija juda tushunarli va ovoz kuchaytirgichdan yozuvni uzatishga o'xshaydi. . Taqqoslash uchun, mashinani o'rganish texnologiyalari va rus tili uchun modellar to'plamiga asoslangan ochiq nutq sintezi dvigatelini taqdim etuvchi Silero loyihasi sifat jihatidan RHVoice'dan ustundir.

Rus tili uchun 13 ta, ingliz tili uchun 5 ta ovozli variant mavjud.Ovozlar tabiiy nutq yozuvlari asosida tuzilgan. Sozlamalarda siz tezlikni, balandlikni va ovoz balandligini o'zgartirishingiz mumkin. Tempni o'zgartirish uchun Sonic kutubxonasidan foydalanish mumkin. Kiritilgan matnni tahlil qilish asosida tillarni avtomatik aniqlash va almashtirish mumkin (masalan, boshqa tildagi so'zlar va qo'shtirnoqlar uchun o'sha tilga xos sintez modelidan foydalanish mumkin). Ovozli profillar qo'llab-quvvatlanadi, ular turli tillar uchun ovozlar kombinatsiyasini belgilaydi.

Manba: opennet.ru

a Izoh qo'shish