Google lança modelo de dados e aprendizado de máquina para separar sons

Google publicado um banco de dados anotado de sons mistos de referência que pode ser usado em sistemas de aprendizado de máquina usados ​​para separar sons mistos arbitrários em seus componentes individuais. Também foi publicado um modelo genérico de aprendizado de máquina profundo (TDCN++) que pode ser usado no Tensorflow para separar sons. Dados preparados com base na coleta freesound.org и publicado licenciado sob CC BY 4.0.

O projeto FUSS (Free Universal Sound Separation) apresentado visa resolver o problema de separação de qualquer número de sons arbitrários, cuja natureza não é conhecida antecipadamente. Outros sistemas semelhantes são geralmente limitados à tarefa de distinguir entre certos sons, como vozes e não-vozes, ou diferentes pessoas falando.

O banco de dados contém cerca de 20 mil mixagens. O kit também inclui respostas de impulso de sala pré-calculadas usando um simulador de sala personalizado que leva em consideração a reflexão da parede, a localização da fonte sonora e a localização do microfone.

Fonte: opennet.ru

Adicionar um comentário