Google、音を分離するためのデータと機械学習モデルをリリース

グーグル опубликовала 任意の混合サウンドを個々のコンポーネントに分離するために使用される機械学習システムで使用できる、参照混合サウンドの注釈付きデータベース。 Tensorflow で音を分離するために使用できる、汎用深層機械学習モデル (TDCN++) も公開されています。 収集したデータをもとに作成したデータ freesound.org и 出版された CC BY 4.0に基づいてライセンスされています。

提示されたプロジェクト FUSS (Free Universal Sound Separation) は、その性質が事前に知られていない任意の数の任意の音を分離する問題を解決することを目的としています。 他の同様のシステムは一般に、音声と非音声、または異なる人々の話など、特定の音を区別するタスクに限定されています。

データベースには約 20 のミキシングが含まれています。 このキットには、壁の反射、音源の位置、マイクの位置を考慮したカスタムビルドのルームシミュレーターを使用して、事前に計算された室内インパルス応答も含まれています。

出所: オープンネット.ru

コメントを追加します