Google rilascia dati e modello di machine learning per separare i suoni

Google pubblicato un database annotato di suoni misti di riferimento che può essere utilizzato nei sistemi di apprendimento automatico utilizzati per separare suoni misti arbitrari nei loro singoli componenti. È stato anche pubblicato un modello generico di deep machine learning (TDCN++) che può essere utilizzato in Tensorflow per separare i suoni. Dati preparati in base alla raccolta freesound.org и pubblicato concesso in licenza con CC BY 4.0.

Il progetto presentato FUSS (Free Universal Sound Separation) mira a risolvere il problema della separazione di un numero qualsiasi di suoni arbitrari, la cui natura non è nota in anticipo. Altri sistemi simili si limitano generalmente al compito di distinguere tra determinati suoni, come voci e non voci, o diverse persone che parlano.

Il database contiene circa 20mila miscele. Il kit include anche risposte all'impulso della stanza precalcolate utilizzando un simulatore di stanza personalizzato che tiene conto della riflessione della parete, della posizione della sorgente sonora e della posizione del microfono.

Fonte: opennet.ru

Aggiungi un commento