Google lansează date și model de învățare automată pentru a separa sunete

Google а publicat o bază de date adnotată de sunete mixte de referință care poate fi utilizată în sistemele de învățare automată utilizate pentru a separa sunete amestecate arbitrare în componentele lor individuale. A fost publicat și un model generic de învățare automată profundă (TDCN++), care poate fi folosit în Tensorflow pentru a separa sunete. Date pregătite pe baza colectării freesound.org и publicat licențiat sub CC BY 4.0.

Proiectul prezentat FUSS (Free Universal Sound Separation) are ca scop rezolvarea problemei separării oricărui număr de sunete arbitrare, a căror natură nu este cunoscută în prealabil. Alte sisteme similare sunt în general limitate la sarcina de a distinge anumite sunete, cum ar fi voci și non-voci, sau diferiți oameni care vorbesc.

Baza de date conține aproximativ 20 de mii de amestecuri. Setul include, de asemenea, răspunsuri la impulsuri precalculate ale camerei, folosind un simulator de cameră personalizat, care ia în considerare reflexia peretelui, locația sursei de sunet și locația microfonului.

Sursa: opennet.ru

Adauga un comentariu