RHVoice 1.8.0 語音合成器發布

開源語音合成系統 RHVoice 1.8.0 發布,最初是為提供對俄語的高質量支持而開發的,但後來適應了其他語言,包括英語、葡萄牙語、烏克蘭語、吉爾吉斯語、韃靼語和格魯吉亞語。 代碼是用 C++ 編寫的,並在 LGPL 2.1 許可下分發。 GNU/Linux、Windows 和 Android 支持工作。 該程序兼容用於文本到語音的典型 TTS(文本到語音)接口:SAPI5 (Windows)、Speech Dispatcher (GNU/Linux) 和 Android Text-To-Speech API,但也可用於NVDA 屏幕閱讀器。 RHVoice 的創建者和主要開發人員是 Olga Yakovleva,儘管她完全失明,但她還是開發了該項目。

Android 平台的 1.8 版本引入了新的語音和語言數據管理系統,允許您在不更新移動應用程序的情況下下載語音數據更新。 檢查添加的語音和語言的數據更新是自動完成的。 此外,新版本引入了對波蘭語的支持,並為馬其頓語添加了新的語音。 確保與 NVDA 屏幕閱讀器的最新 alpha 和 beta 版本兼容。 修復了 Speech Dispatcher 不存在時發生的 Linux 構建問題。

回想一下,RHVoice 使用了 HTS 項目(基於 HMM / DNN 的語音合成系統)的開發和具有統計模型的參數合成方法(基於 HMM 的統計參數合成 - 隱馬爾可夫模型)。 統計模型的優點是開銷低且對 CPU 能力要求不高。 所有操作都在用戶系統上本地執行。 支持三個級別的語音質量(質量越低,性能越高,響應時間越短)。

統計模型的缺點是發音質量相對較低,達不到合成器根據自然語音片段組合生成語音的水平,但結果非常清晰,類似於揚聲器的廣播錄音. 相比之下,提供基於機器學習技術的語音合成開放引擎和一套俄語模型的Silero項目在質量上超越了RHVoice。

俄語有 14 種語音選項,英語有 6 種。語音是根據自然語音錄音形成的。 在設置中,您可以更改速度、音高和音量。 Sonic 庫可用於更改速度。 可以根據對輸入文本的分析自動檢測和切換語言(例如,對於另一種語言的單詞和引語,可以使用該語言的本地合成模型)。 支持定義不同語言的語音組合的語音配置文件。

來源: opennet.ru

添加評論