Google publica datos e modelos de aprendizaxe automática para separar os sons

Google publicado unha base de datos anotada de sons mesturados de referencia que se poden usar en sistemas de aprendizaxe automática utilizados para separar sons mesturados arbitrarios nos seus compoñentes individuais. Tamén se publicou un modelo xenérico de aprendizaxe automática profunda (TDCN++) que se pode usar en Tensorflow para separar sons. Datos elaborados a partir da recollida freesound.org и publicado licenciado baixo CC BY 4.0.

O proxecto presentado FUSS (Free Universal Sound Separation) ten como obxectivo resolver o problema de separar calquera número de sons arbitrarios, cuxa natureza non se coñece de antemán. Outros sistemas similares limítanse xeralmente á tarefa de distinguir entre certos sons, como voces e non voces, ou diferentes persoas que falan.

A base de datos contén preto de 20 mil mesturas. O kit tamén inclúe respostas de impulso da sala precalculadas mediante un simulador de sala personalizado que ten en conta a reflexión da parede, a localización da fonte de son e a localización do micrófono.

Fonte: opennet.ru

Engadir un comentario