Google objavljuje model podataka i mašinskog učenja za razdvajanje zvukova

Google objavljeno anotirana referentna baza podataka mešanih zvukova koja se može koristiti u sistemima mašinskog učenja koji se koriste za razdvajanje proizvoljnih mešanih zvukova u pojedinačne komponente. Također je objavljen generički model dubokog učenja (TDCN++) koji se može koristiti u Tensorflowu za razdvajanje zvukova. Podaci pripremljeni na osnovu prikupljanja freesound.org и objavljeno licencirano pod CCBY 4.0.

Predstavljeni projekat FUSS (Free Universal Sound Separation) ima za cilj rješavanje problema odvajanja bilo kojeg broja proizvoljnih zvukova čija priroda nije unaprijed poznata. Drugi takvi sistemi su generalno ograničeni na zadatak razdvajanja određenih zvukova, kao što su glasovi i neglasovi, ili različiti ljudi koji govore.

Baza podataka sadrži oko 20 hiljada mikseva. Paket takođe uključuje unapred izračunate impulsne odzive prostorije pripremljene sa simulatorom prostorije napravljenim po meri koji uzima u obzir refleksije zida, lokaciju izvora zvuka i lokaciju mikrofona.

izvor: opennet.ru

Dodajte komentar