Google објавува податоци и модел за машинско учење за да ги одвои звуците

Google објавено означена база на податоци за референтни мешани звуци што може да се користи во системите за машинско учење што се користат за одделување на произволни мешани звуци во нивните поединечни компоненти. Објавен е и генерички модел за длабоко машинско учење (TDCN++) кој може да се користи во Tensorflow за одвојување звуци. Податоци подготвени врз основа на збирката freesound.org и објавено лиценцирана според CC BY 4.0.

Презентираниот проект FUSS (Free Universal Sound Separation) е насочен кон решавање на проблемот со одвојување на кој било број произволни звуци, чија природа не е однапред позната. Другите слични системи генерално се ограничени на задачата да разликуваат одредени звуци, како гласови и негласови, или различни луѓе кои зборуваат.

Базата на податоци содржи околу 20 илјади мешавини. Комплетот, исто така, вклучува однапред пресметани одговори на импулси во просторијата со помош на прилагоден симулатор за просторија што ја зема предвид рефлексијата на ѕидот, локацијата на изворот на звук и локацијата на микрофонот.

Извор: opennet.ru

Додадете коментар