Google julkaisee datan ja koneoppimismallin erottaakseen äänet

Google julkaistu annotoitu tietokanta viitesekoitetuista äänistä, jota voidaan käyttää koneoppimisjärjestelmissä, joita käytetään mielivaltaisten sekoitettujen äänien erottamiseen yksittäisiksi komponenteiksi. Myös yleinen syvä koneoppimismalli (TDCN++) on julkaistu, jota voidaan käyttää Tensorflow:ssa äänien erottamiseen. Keräyksen perusteella laaditut tiedot freesound.org и julkaistu lisensoitu CC BY 4.0:lla.

Esitetty projekti FUSS (Free Universal Sound Separation) pyrkii ratkaisemaan minkä tahansa määrän mielivaltaisten äänten erottamisongelman, jonka luonnetta ei tiedetä etukäteen. Muut vastaavat järjestelmät rajoittuvat yleensä tiettyjen äänien, kuten äänien ja ei-äänien tai eri puhuvien ihmisten erottamiseen.

Tietokanta sisältää noin 20 tuhatta sekoitusta. Sarja sisältää myös ennalta lasketut huoneimpulssivasteet räätälöidyn huonesimulaattorin avulla, joka ottaa huomioon seinäheijastuksen, äänilähteen sijainnin ja mikrofonin sijainnin.

Lähde: opennet.ru

Lisää kommentti