神经网络将俄语语音合成的质量提升到了一个新的水平

MDG 集团公司是俄罗斯联邦储蓄银行生态系统的一部分,宣布开发出先进的语音合成平台,据说可以确保任何文本的流畅和富有表现力的阅读。

所提出的解决方案是第三代语音合成系统。 高质量的音频信号是由复杂的神经网络模型生成的。 开发人员声称这些算法的结果是最真实的俄语语音合成。

神经网络将俄语语音合成的质量提升到了一个新的水平

该平台包括一个用于预测基础词典中尚未出现的单词重音的模块。 此外,还提供了常见拼写错误的自动更正。 由于对文本进行了深入的语言分析,即使在困难的情况下,发音也将符合语言的规范。

该平台的另一个优点是不需要配备GPU加速器的昂贵服务器。 您可以通过两种方式使用该技术:通过云服务或将其集成到您自己的解决方案中。


神经网络将俄语语音合成的质量提升到了一个新的水平

该开发的可能应用领域包括聊天机器人和语音助手、信息和通知服务、通话期间即时合成任何文本的语音服务等。

开发人员表示:“在与客户通信的自动化场景中,该技术允许您与每个订阅者单独交互,因为没有固定消息,并且可以在通话过程中合成任何文本。”

你可以尝试一下技术 这里



来源: 3dnews.ru

添加评论