Ochiq nutq sintezi tizimi RHVoice 1.6.0 chiqarildi, dastlab rus tilini yuqori sifatli qo'llab-quvvatlash uchun ishlab chiqilgan, ammo keyin boshqa tillar, jumladan, ingliz, portugal, ukrain, qirg'iz, tatar va gruzin tillari uchun moslashtirilgan. Kod C++ da yozilgan va LGPL 2.1 litsenziyasi ostida tarqatilgan. GNU/Linux, Windows va Androidda ishlashni qo'llab-quvvatlaydi. Dastur matnni nutqqa aylantirish uchun standart TTS (matnni nutqqa) interfeyslari bilan mos keladi: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) va Android Text-to-Speech API, lekin NVDA da ham foydalanish mumkin. ekran o'quvchi. RHVoice-ning yaratuvchisi va asosiy ishlab chiquvchisi Olga Yakovleva bo'lib, u butunlay ko'r bo'lishiga qaramay loyihani ishlab chiqadi.
Π Π½ΠΎΠ²ΠΎΠΉ Π²Π΅ΡΡΠΈΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΎ 5 Π½ΠΎΠ²ΡΡ Π²Π°ΡΠΈΠ°Π½ΡΠΎΠ² Π³ΠΎΠ»ΠΎΡΠΎΠ² Π΄Π»Ρ ΡΡΡΡΠΊΠΎΠΉ ΡΠ΅ΡΠΈ. Π Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° Π°Π»Π±Π°Π½ΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°. ΠΠ±Π½ΠΎΠ²Π»ΡΠ½ ΡΠ»ΠΎΠ²Π°ΡΡ Π΄Π»Ρ ΡΠΊΡΠ°ΠΈΠ½ΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°. Π Π°ΡΡΠΈΡΠ΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ² emoji. ΠΡΠΎΠ²Π΅Π΄Π΅Π½Π° ΡΠ°Π±ΠΎΡΠ° ΠΏΠΎ ΡΡΡΡΠ°Π½Π΅Π½ΠΈΡ ΠΎΡΠΈΠ±ΠΎΠΊ Π² ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΈ Π΄Π»Ρ ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ Android, ΡΠΏΡΠΎΡΡΠ½ ΠΈΠΌΠΏΠΎΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΈΡ ΡΠ»ΠΎΠ²Π°ΡΠ΅ΠΉ, Π° ΡΠ°ΠΊΠΆΠ΅ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π° ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΠΏΠ»Π°ΡΡΠΎΡΠΌΡ Android 11. Π ΡΠ΄ΡΠΎ Π΄Π²ΠΈΠΆΠΊΠ° Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ Π½ΠΎΠ²ΡΠ΅ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ ΠΈ ΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ, Π²ΠΊΠ»ΡΡΠ°Ρ g2p.case, word_break ΠΈ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΡ ΡΠΈΠ»ΡΡΡΠΎΠ² ΡΠΊΠ²Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ.
Eslatib o'tamiz, RHVoice HTS loyihasining ishlanmalaridan (HMM/DNN-ga asoslangan nutqni sintez qilish tizimi) va statistik modellar bilan parametrik sintez usulidan (HMM asosidagi statistik parametrik sintez - Yashirin Markov modeli) foydalanadi. Statistik modelning afzalligi past xarajatlar va oddiy protsessor quvvatidir. Barcha operatsiyalar foydalanuvchi tizimida mahalliy ravishda amalga oshiriladi. Nutq sifatining uchta darajasi qo'llab-quvvatlanadi (sifat qanchalik past bo'lsa, unumdorlik shunchalik yuqori bo'ladi va reaktsiya vaqti qisqaradi).
Statistik modelning salbiy tomoni talaffuzning nisbatan past sifati bo'lib, u tabiiy nutq fragmentlari kombinatsiyasi asosida nutqni yaratadigan sintezatorlar darajasiga etib bormaydi, ammo shunga qaramay, natija juda tushunarli va ovoz kuchaytirgichdan yozuvni uzatishga o'xshaydi. . Taqqoslash uchun, mashinani o'rganish texnologiyalari va rus tili uchun modellar to'plamiga asoslangan ochiq nutq sintezi dvigatelini taqdim etuvchi Silero loyihasi sifat jihatidan RHVoice'dan ustundir.
Rus tili uchun 13 ta, ingliz tili uchun 5 ta ovozli variant mavjud.Ovozlar tabiiy nutq yozuvlari asosida tuzilgan. Sozlamalarda siz tezlikni, balandlikni va ovoz balandligini o'zgartirishingiz mumkin. Tempni o'zgartirish uchun Sonic kutubxonasidan foydalanish mumkin. Kiritilgan matnni tahlil qilish asosida tillarni avtomatik aniqlash va almashtirish mumkin (masalan, boshqa tildagi so'zlar va qo'shtirnoqlar uchun o'sha tilga xos sintez modelidan foydalanish mumkin). Ovozli profillar qo'llab-quvvatlanadi, ular turli tillar uchun ovozlar kombinatsiyasini belgilaydi.
Manba: opennet.ru