谷歌發布數據和機器學習模型來分離聲音

谷歌 опубликовала 參考混合聲音的註釋資料庫,可用於機器學習系統,用於將任意混合聲音分離為其單獨的組件。 通用深度機器學習模型 (TDCN++) 也已發布,可用於 Tensorflow 中分離聲音。 根據收集準備的數據 自由之聲.org и 發表 根據 CC BY 4.0 授權。

提出的項目 FUSS(自由通用聲音分離)旨在解決分離任意數量的任意聲音的問題,而這些聲音的性質事先是未知的。 其他類似的系統通常僅限於區分某些聲音的任務,例如語音和非語音,或不同的人說話。

該資料庫包含大約 20 個混合。 該套件還包括使用定制的房間模擬器預先計算的房間脈衝響應,該模擬器考慮了牆壁反射、聲音來源位置和麥克風位置。

來源: opennet.ru

添加評論