ロシア語向けに開発された音声合成装置 RHVoice 1.2.4 のリリース

オープン音声合成システム RHVoice 1.2.4 のリリースが公開されました。当初はロシア語に高品質のサポートを提供するために開発されましたが、その後、英語、ポルトガル語、ウクライナ語、キルギス語、タタール語、グルジア語などの他の言語にも適応されました。コードは C++ で書かれており、LGPL 2.1 ライセンスに基づいて配布されます。 GNU/Linux、Windows、Android での作業をサポートします。このプログラムは、テキストを音声に変換するための標準 TTS (テキスト読み上げ) インターフェイス、SAPI5 (Windows)、Speech Dispatcher (GNU/Linux)、および Android Text-To-Speech API と互換性がありますが、NVDA でも使用できます。スクリーンリーダー。

このプログラムは、統計モデルを使用したパラメトリック合成手法 (HMM に基づく統計的パラメトリック合成 (隠れマルコフ モデル)) を使用します。統計モデルの利点は、オーバーヘッド コストが低く、CPU パワーがそれほど要求されないことです。すべての操作はユーザーのシステム上でローカルに実行されます。 3 つのレベルの音声品質がサポートされています (品質が低いほど、パフォーマンスは向上し、反応時間は短くなります)。

音声の設定と変更をサポートします。ロシア語では 9 つの音声オプション、英語では 5 つの音声オプションが利用可能です。音声は自然な音声の録音に基づいて作成されます。統計モデルを使用しているため、発音の品質は自然音声の断片の組み合わせに基づいて音声を生成するシンセサイザーのレベルには達しませんが、それでも結果は非常に理解しやすく、スピーカーからの録音の放送に似ています。 。

設定では、速度、ピッチ、音量を変更できます。 Sonicライブラリを使用してテンポを変更できます。入力テキストの分析に基づいて言語を自動的に検出して切り替えることが可能です(たとえば、別の言語の単語や引用符については、その言語にネイティブな合成モデルを使用できます)。音声プロファイルがサポートされており、さまざまな言語の音声の組み合わせを定義します。

出所: オープンネット.ru

コメントを追加します