提案されたセットは、機械学習システムでモデルを構築するために使用できます。 認識 и 合成 スピーチ。データ 出版された パブリックドメインとして(CC0)。 Common Voice プロジェクトは、声と話し方の多様性を考慮した音声パターンのデータベースを蓄積するための共同作業を組織することを目的としていることに注意してください。ユーザーは、画面に表示されたフレーズを発声したり、他のユーザーが追加したデータの品質を評価したりできます。人間の音声の典型的なフレーズのさまざまな発音の記録を含む蓄積されたデータベースは、機械学習システムや研究プロジェクトで制限なく使用できます。
Common Voice プロジェクトの欠点の XNUMX つは、連続音声認識ライブラリの作成者であることです。 ボスク彼は名前付き 音声素材の一方性(20~30歳代の男性が多く、女性、子供、高齢者の声は素材が少ない)、辞書の多様性の欠如(同じフレーズの繰り返し)、分布歪んだ MP3 形式での録音、既存のプロジェクトに参加する代わりに新しいプロジェクトの作成 ヴォックスフォージ.