Google lanza un modelo de datos y aprendizaje automático para separar sonidos

Google опубликовала una base de datos anotada de sonidos mixtos de referencia que se puede utilizar en sistemas de aprendizaje automático utilizados para separar sonidos mixtos arbitrarios en sus componentes individuales. También se ha publicado un modelo genérico de aprendizaje automático profundo (TDCN++) que se puede utilizar en Tensorflow para separar sonidos. Datos elaborados a partir de la recogida. freesound.org и publicado Licenciado bajo CC BY 4.0.

El proyecto presentado FUSS (Free Universal Sound Separation) tiene como objetivo resolver el problema de separar cualquier número de sonidos arbitrarios, cuya naturaleza no se conoce de antemano. Otros sistemas similares generalmente se limitan a la tarea de distinguir entre determinados sonidos, como voces y no voces, o diferentes personas hablando.

La base de datos contiene alrededor de 20 mil mezclas. El kit también incluye respuestas de impulso de sala precalculadas utilizando un simulador de sala personalizado que tiene en cuenta el reflejo de la pared, la ubicación de la fuente de sonido y la ubicación del micrófono.

Fuente: opennet.ru

Añadir un comentario