Гоогле објављује модел података и машинског учења за раздвајање звукова

Гоогле опубликовала обележена база података референтних мешаних звукова која се може користити у системима машинског учења који се користе за раздвајање произвољних мешаних звукова у њихове појединачне компоненте. Такође је објављен генерички модел дубоког машинског учења (ТДЦН++) који се може користити у Тенсорфлов-у за раздвајање звукова. Подаци припремљени на основу збирке фреесоунд.орг и објављено лиценцирано под ЦЦ БИ 4.0.

Представљени пројекат ФУСС (Фрее Универсал Соунд Сепаратион) има за циљ да реши проблем одвајања било ког броја произвољних звукова, чија природа није унапред позната. Други слични системи су углавном ограничени на задатак разликовања одређених звукова, као што су гласови и негласови, или различитих људи који говоре.

База података садржи око 20 хиљада мешања. Комплет такође укључује унапред израчунате импулсне одзиве просторије користећи прилагођени симулатор просторије који узима у обзир рефлексију зида, локацију извора звука и локацију микрофона.

Извор: опеннет.ру

Додај коментар