谷歌发布数据和机器学习模型来分离声音

谷歌 опубликовала 参考混合声音的带注释数据库,可用于机器学习系统,用于将任意混合声音分离为其单独的组件。 通用深度机器学习模型 (TDCN++) 也已发布,可用于 Tensorflow 中分离声音。 根据收集准备的数据 自由之声.org и 发表 根据 CC BY 4.0 获得许可。

提出的项目 FUSS(自由通用声音分离)旨在解决分离任意数量的任意声音的问题,而这些声音的性质事先是未知的。 其他类似的系统通常仅限于区分某些声音的任务,例如语音和非语音,或不同的人说话。

该数据库包含大约 20 个混合。 该套件还包括使用定制的房间模拟器预先计算的房间脉冲响应,该模拟器考虑了墙壁反射、声源位置和麦克风位置。

来源: opennet.ru

添加评论