Google publica dades i un model d'aprenentatge automàtic per dividir els sons

Google publicat una base de dades anotada de sons barrejats de referència que es poden utilitzar en sistemes d'aprenentatge automàtic utilitzats per separar sons barrejats arbitraris en els seus components individuals. També s'ha publicat un model genèric d'aprenentatge automàtic profund (TDCN++) que es pot utilitzar a Tensorflow per separar sons. Dades elaborades a partir de la recollida freesound.org и publicat amb llicència CC BY 4.0.

El projecte presentat FUSS (Free Universal Sound Separation) té com a objectiu resoldre el problema de separar qualsevol nombre de sons arbitraris, la naturalesa dels quals no es coneix per endavant. Altres sistemes similars es limiten generalment a la tasca de distingir entre determinats sons, com veus i no veus, o diferents persones que parlen.

La base de dades conté unes 20 mil mescles. El kit també inclou respostes d'impuls de l'habitació precalculades mitjançant un simulador d'habitació personalitzat que té en compte la reflexió de la paret, la ubicació de la font de so i la ubicació del micròfon.

Font: opennet.ru

Afegeix comentari