Google vydává data a model strojového učení k oddělení zvuků

Google publikováno anotovaná databáze referenčních smíšených zvuků, které lze použít v systémech strojového učení používaných k oddělení libovolných smíšených zvuků do jejich jednotlivých složek. Byl také publikován obecný model hlubokého strojového učení (TDCN++), který lze v Tensorflow použít k oddělení zvuků. Data připravená na základě sběru freesound.org и zveřejněno licencováno pod CC BY 4.0.

Prezentovaný projekt FUSS (Free Universal Sound Separation) je zaměřen na řešení problému separace libovolného počtu libovolných zvuků, jejichž povaha není předem známa. Jiné podobné systémy jsou obecně omezeny na úkol rozlišovat mezi určitými zvuky, jako jsou hlasy a nehlasy, nebo různí lidé mluvící.

Databáze obsahuje cca 20 tisíc mixů. Sada také obsahuje předem vypočítané pokojové impulsní odezvy pomocí na zakázku vyrobeného simulátoru místnosti, který bere v úvahu odraz stěny, umístění zdroje zvuku a umístění mikrofonu.

Zdroj: opennet.ru

Přidat komentář