Google vydáva model údajov a strojového učenia na oddelenie zvukov

Google опубликовала anotovaná databáza referenčných zmiešaných zvukov, ktoré možno použiť v systémoch strojového učenia používaných na oddelenie ľubovoľných zmiešaných zvukov do ich jednotlivých komponentov. Bol zverejnený aj všeobecný model hlbokého strojového učenia (TDCN++), ktorý možno použiť v Tensorflow na oddelenie zvukov. Údaje pripravené na základe zberu freesound.org и publikovaný licencované podľa CC BY 4.0.

Prezentovaný projekt FUSS (Free Universal Sound Separation) je zameraný na riešenie problému separácie ľubovoľného počtu ľubovoľných zvukov, ktorých povaha nie je vopred známa. Iné podobné systémy sa vo všeobecnosti obmedzujú na úlohu rozlišovania medzi určitými zvukmi, ako sú hlasy a nehlasy, alebo hovoriacimi rôznymi ľuďmi.

Databáza obsahuje asi 20 tisíc mixov. Súprava tiež obsahuje vopred vypočítané priestorové impulzné odozvy pomocou vlastného simulátora miestnosti, ktorý berie do úvahy odraz steny, umiestnenie zdroja zvuku a umiestnenie mikrofónu.

Zdroj: opennet.ru

Pridať komentár