Google geeft een data- en machine learning-model vrij om geluiden te scheiden

Google опубликовала een geannoteerde database met gemengde referentiegeluiden die kunnen worden gebruikt in machine learning-systemen die worden gebruikt om willekeurige gemengde geluiden in hun afzonderlijke componenten te scheiden. Er is ook een generiek deep machine learning-model (TDCN++) gepubliceerd dat in Tensorflow kan worden gebruikt om geluiden te scheiden. Gegevens opgesteld op basis van de verzameling freesound.org и gepubliceerd gelicentieerd onder CC BY 4.0.

Het gepresenteerde project FUSS (Free Universal Sound Separation) is gericht op het oplossen van het probleem van het scheiden van een willekeurig aantal willekeurige geluiden, waarvan de aard niet van tevoren bekend is. Andere soortgelijke systemen zijn over het algemeen beperkt tot de taak om onderscheid te maken tussen bepaalde geluiden, zoals stemmen en niet-stemmen, of verschillende mensen die spreken.

De database bevat ongeveer 20 mixen. De kit bevat ook vooraf berekende kamerimpulsreacties met behulp van een op maat gemaakte kamersimulator die rekening houdt met muurreflectie, de locatie van de geluidsbron en de locatie van de microfoon.

Bron: opennet.ru

Voeg een reactie