انتشار سینت سایزر گفتار RHVoice 1.2.4، توسعه یافته برای زبان روسی

انتشار سیستم سنتز گفتار باز RHVoice 1.2.4 منتشر شده است که در ابتدا برای ارائه پشتیبانی با کیفیت از زبان روسی توسعه یافت، اما سپس برای سایر زبان‌ها از جمله انگلیسی، پرتغالی، اوکراینی، قرقیزی، تاتاری و گرجی سازگار شد. کد به زبان C++ نوشته شده و تحت مجوز LGPL 2.1 توزیع شده است. از کار بر روی گنو/لینوکس، ویندوز و اندروید پشتیبانی می کند. این برنامه با رابط های استاندارد TTS (متن به گفتار) برای تبدیل متن به گفتار سازگار است: SAPI5 (ویندوز)، دیسپچر گفتار (GNU/Linux) و Android Text-to-Speech API، اما می تواند در NVDA نیز استفاده شود. صفحه خوان.

این برنامه از روش سنتز پارامتریک با مدل های آماری (Statistical Parametric Synthesis based on HMM - Hidden Markov Model) استفاده می کند. مزیت مدل آماری هزینه های سربار پایین و توان بی نیاز CPU است. تمام عملیات به صورت محلی بر روی سیستم کاربر انجام می شود. سه سطح از کیفیت گفتار پشتیبانی می شود (هرچه کیفیت پایین تر، عملکرد بالاتر و زمان واکنش کوتاه تر باشد).

از تنظیم و تغییر صدا پشتیبانی می کند. 9 گزینه صوتی برای زبان روسی و 5 گزینه برای زبان انگلیسی وجود دارد. به دلیل استفاده از یک مدل آماری، کیفیت تلفظ به سطح سینت سایزرهایی نمی رسد که بر اساس ترکیبی از قطعات گفتار طبیعی، گفتار تولید می کنند، اما با این وجود، نتیجه کاملاً قابل درک است و شبیه پخش یک ضبط شده از بلندگو است. .

در تنظیمات می توانید سرعت، گام و صدا را تغییر دهید. از کتابخانه Sonic می توان برای تغییر سرعت استفاده کرد. تشخیص خودکار و تغییر زبان ها بر اساس تجزیه و تحلیل متن ورودی امکان پذیر است (به عنوان مثال، برای کلمات و نقل قول ها در زبان دیگر، می توان از یک مدل ترکیبی بومی آن زبان استفاده کرد). پروفایل های صوتی پشتیبانی می شوند و ترکیبی از صداها را برای زبان های مختلف تعریف می کنند.

منبع: opennet.ru

اضافه کردن نظر