Mozilla Common Voice 12.0 音声アップデート

Mozilla は Common Voice データセットを更新し、200 人を超える人々の発音サンプルを追加しました。 データはパブリックドメイン(CC0)として公開されています。 提案されたセットは、機械学習システムで音声認識および合成モデルを構築するために使用できます。

前回のアップデートと比較して、コレクション内のスピーチ素材の量は、23.8 時間から 25.8 千時間のスピーチに増加しました。 88万3161千人以上が英語での資料作成に参加し、84時間のスピーチが行われた(参加者は3098万7903千人、1419時間)。 ベラルーシ語のセットには、6965 人の参加者と 1217 時間のスピーチ資料 (2815 人の参加者と 229 時間)、ロシア語 - 2731 人の参加者と 215 時間 (2092 人の参加者と 262 時間)、ウズベク語 - 2025 人の参加者と 258 時間のスピーチ資料が含まれています。参加者は780名で87時間)、ウクライナ語 - 参加者は759名で87時間(参加者はXNUMX名でXNUMX時間)でした。

Common Voice プロジェクトは、声や話し方の多様性を考慮した音声パターンのデータベースを蓄積するための共同作業を組織することを目的としています。 ユーザーは、画面に表示されたフレーズを発声したり、他のユーザーが追加したデータの品質を評価したりできます。 人間の音声の典型的なフレーズのさまざまな発音の記録を含む蓄積されたデータベースは、機械学習システムや研究プロジェクトで制限なく使用できます。

出所: オープンネット.ru

コメントを追加します