Google publie un modèle de données et d'apprentissage automatique pour séparer les sons

Google опубликовала Une base de données de sons mixtes de référence, annotés, peut être utilisée dans les systèmes d'apprentissage automatique pour séparer des sons mixtes arbitraires en leurs composantes individuelles. Un modèle d'apprentissage profond à usage général (TDCN++), utilisable dans Tensorflow pour la séparation des sons, a également été publié. Les données sont basées sur la collection. freesound.org и publié Sous licence CC BY 4.0.

Le projet FUSS (Free Universal Sound Separation) présenté vise à résoudre le problème de la séparation d'un nombre quelconque de sons arbitraires dont la nature est inconnue à l'avance. D'autres systèmes similaires se limitent généralement à la séparation de sons spécifiques, tels que les voix et les sons non vocaux, ou entre différents locuteurs.

La base de données contient environ 20 000 mélanges. L'ensemble inclut également des réponses impulsionnelles de salle précalculées, générées à l'aide d'un simulateur de salle spécialement conçu et prenant en compte les réflexions sur les murs, la localisation de la source sonore et la position du microphone.

Source: opennet.ru

Achetez un hébergement fiable pour les sites avec protection DDoS, serveurs VPS VDS 🔥 Achetez un hébergement web fiable avec protection DDoS, serveurs VPS et VDS | ProHoster