Google publie un modèle de données et d'apprentissage automatique pour séparer les sons

Google опубликовала une base de données annotée de sons mixés de référence qui peut être utilisée dans des systèmes d'apprentissage automatique utilisés pour séparer les sons mixés arbitraires en leurs composants individuels. Un modèle générique d'apprentissage automatique profond (TDCN++) a également été publié et peut être utilisé dans Tensorflow pour séparer les sons. Données préparées sur la base de la collecte freesound.org и publié sous licence CC BY 4.0.

Le projet présenté FUSS (Free Universal Sound Separation) vise à résoudre le problème de la séparation d'un nombre quelconque de sons arbitraires, dont la nature n'est pas connue à l'avance. D'autres systèmes similaires se limitent généralement à la tâche de distinguer certains sons, tels que les voix et les non-voix, ou différentes personnes qui parlent.

La base de données contient environ 20 XNUMX mélanges. Le kit comprend également des réponses impulsionnelles de pièce précalculées à l'aide d'un simulateur de pièce personnalisé qui prend en compte la réflexion des murs, l'emplacement de la source sonore et l'emplacement du microphone.

Source: opennet.ru

Ajouter un commentaire