RHVoice 1.6.0 语音合成器发布

开放式语音合成系统 RHVoice 1.6.0 发布,最初是为俄语提供高质量支持而开发的,但后来针对其他语言进行了适配,包括英语、葡萄牙语、乌克兰语、吉尔吉斯语、鞑靼语和格鲁吉亚语。 该代码是用 C++ 编写的,并根据 LGPL 2.1 许可证分发。 支持 GNU/Linux、Windows 和 Android 上的工作。 该程序与用于将文本转换为语音的标准 TTS(文本转语音)接口兼容:SAPI5 (Windows)、语音调度程序 (GNU/Linux) 和 Android 文本转语音 API,但也可在 NVDA 中使用屏幕阅读器。 RHVoice 的创建者和主要开发人员是 Olga Yakovleva,她在完全失明的情况下开发了该项目。

新版本为俄语语音添加了 5 个新的语音选项。 阿尔巴尼亚语支持已实现。 乌克兰语词典已更新。 扩大了对表情符号角色配音的支持。 已完成消除 Android 平台应用程序中的错误的工作,简化了自定义词典的导入,并添加了对 Android 11 平台的支持。在引擎核心中添加了新的设置和功能,包括 g2p。 case、word_break 和对均衡过滤器的支持。

让我们回想一下,RHVoice 使用了 HTS 项目(基于 HMM/DNN 的语音合成系统)和带有统计模型的参数合成方法(基于 HMM - 隐马尔可夫模型的统计参数合成)的开发。 统计模型的优点是开销成本低且对 CPU 能力要求不高。 所有操作均在用户系统本地执行。 支持三个级别的语音质量(质量越低,性能越高,反应时间越短)。

统计模型的缺点是发音质量相对较低,达不到基于自然语音片段组合生成语音的合成器的水平,但结果非常清晰,类似于从扬声器广播录音。 相比之下,Silero 项目提供了基于机器学习技术的开放式语音合成引擎和一组俄语模型,其质量优于 RHVoice。

俄语有 13 种语音选项,英语有 5 种语音选项。这些语音是根据自然语音录音形成的。 在设置中,您可以更改速度、音高和音量。 Sonic 库可用于更改速度。 可以根据输入文本的分析自动检测和切换语言(例如,对于另一种语言的单词和引号,可以使用该语言原生的合成模型)。 支持语音配置文件,定义不同语言的语音组合。

来源: opennet.ru

添加评论