RHVoice 1.8.0 语音合成器发布

开放式语音合成系统 RHVoice 1.8.0 发布,最初是为俄语提供高质量支持而开发的,但后来针对其他语言进行了适配,包括英语、葡萄牙语、乌克兰语、吉尔吉斯语、鞑靼语和格鲁吉亚语。 该代码是用 C++ 编写的,并根据 LGPL 2.1 许可证分发。 支持 GNU/Linux、Windows 和 Android 上的工作。 该程序与用于将文本转换为语音的标准 TTS(文本转语音)接口兼容:SAPI5 (Windows)、语音调度程序 (GNU/Linux) 和 Android 文本转语音 API,但也可在 NVDA 中使用屏幕阅读器。 RHVoice 的创建者和主要开发人员是 Olga Yakovleva,她在完全失明的情况下开发了该项目。

Android平台的1.8版本引入了新的语音和语言数据管理系统,允许您下载语音数据更新而无需更新移动应用程序。自动检查添加的语音和语言的数据更新。此外,新版本还引入了对波兰语的支持,并添加了马其顿语的新语音。确保与 NVDA 屏幕阅读器的最新 alpha 和 beta 版本兼容。修复了当语音调度程序不存在时在 Linux 平台上构建时发生的问题。

让我们回想一下,RHVoice 使用了 HTS 项目(基于 HMM/DNN 的语音合成系统)和带有统计模型的参数合成方法(基于 HMM - 隐马尔可夫模型的统计参数合成)的开发。 统计模型的优点是开销成本低且对 CPU 能力要求不高。 所有操作均在用户系统本地执行。 支持三个级别的语音质量(质量越低,性能越高,反应时间越短)。

统计模型的缺点是发音质量相对较低,达不到基于自然语音片段组合生成语音的合成器的水平,但结果非常清晰,类似于从扬声器广播录音。 相比之下,Silero 项目提供了基于机器学习技术的开放式语音合成引擎和一组俄语模型,其质量优于 RHVoice。

俄语有 14 种语音选项,英语有 6 种语音选项。这些语音是根据自然语音录音形成的。 在设置中,您可以更改速度、音高和音量。 Sonic 库可用于更改速度。 可以根据输入文本的分析自动检测和切换语言(例如,对于另一种语言的单词和引号,可以使用该语言原生的合成模型)。 支持语音配置文件,定义不同语言的语音组合。

来源: opennet.ru

添加评论