شبکه های عصبی کیفیت سنتز گفتار روسی را به سطح جدیدی رسانده اند

گروه شرکت‌های MDG، بخشی از اکوسیستم Sberbank، توسعه یک پلتفرم پیشرفته ترکیب گفتار را اعلام کرد که گفته می‌شود خواندن روان و گویا هر متنی را تضمین می‌کند.

راه حل ارائه شده نسل سوم سیستم سنتز گفتار است. سیگنال های صوتی با کیفیت بالا توسط مدل های پیچیده شبکه عصبی تولید می شوند. توسعه دهندگان ادعا می کنند که نتیجه این الگوریتم ها واقعی ترین سنتز گفتار به زبان روسی است.

شبکه های عصبی کیفیت سنتز گفتار روسی را به سطح جدیدی رسانده اند

این پلتفرم شامل یک ماژول برای پیش بینی استرس در کلماتی است که هنوز در فرهنگ لغت پایه نیستند. علاوه بر این، تصحیح خودکار اشتباهات املایی رایج ارائه شده است. به لطف تجزیه و تحلیل عمیق زبانی متن، تلفظ حتی در موارد دشوار با هنجارهای زبان مطابقت دارد.

مزیت دیگر این پلتفرم این است که به سرورهای گران قیمت مجهز به شتاب دهنده های GPU نیاز ندارد. شما می توانید از این فناوری به دو صورت استفاده کنید: از طریق یک سرویس ابری یا با ادغام آن در راه حل خود.


شبکه های عصبی کیفیت سنتز گفتار روسی را به سطح جدیدی رسانده اند

از جمله زمینه های ممکن برای کاربرد توسعه می توان به چت بات ها و دستیارهای صوتی، خدمات اطلاعات و اطلاع رسانی، خدمات صوتی با ترکیب فوری هر متنی در حین تماس و غیره اشاره کرد.

توسعه دهندگان می گویند: "در سناریوهای خودکار ارتباط با مشتریان، این فناوری به شما امکان می دهد با هر مشترک به صورت جداگانه تعامل داشته باشید، زیرا هیچ پیام ثابتی وجود ندارد و هر متنی را می توان در طول تماس ترکیب کرد."

می توانید فناوری را امتحان کنید اینجا



منبع: 3dnews.ru

اضافه کردن نظر