Google izda model podatkov in strojnega učenja za ločevanje zvokov

Google objavljeno označeno zbirko podatkov referenčnih mešanih zvokov, ki se lahko uporabljajo v sistemih strojnega učenja, ki se uporabljajo za ločevanje poljubnih mešanih zvokov na njihove posamezne komponente. Objavljen je bil tudi generični model globokega strojnega učenja (TDCN++), ki ga je mogoče uporabiti v Tensorflow za ločevanje zvokov. Podatki pripravljeni na podlagi zbirke freesound.org и objavljeno licenciran pod CC BY 4.0.

Predstavljeni projekt FUSS (Free Universal Sound Separation) je namenjen reševanju problema ločevanja poljubnega števila poljubnih zvokov, katerih narava ni vnaprej znana. Drugi podobni sistemi so na splošno omejeni na nalogo razlikovanja med določenimi zvoki, kot so glasovi in ​​neglasovi, ali govorjenje različnih ljudi.

Baza podatkov vsebuje približno 20 tisoč mešanic. Komplet vključuje tudi vnaprej izračunane impulzne odzive prostora z uporabo po meri izdelanega simulatorja prostora, ki upošteva odboj od stene, lokacijo vira zvoka in lokacijo mikrofona.

Vir: opennet.ru

Dodaj komentar