Google objavljuje podatke i model strojnog učenja za razdvajanje zvukova

Google опубликовала označena baza podataka referentnih miješanih zvukova koja se može koristiti u sustavima strojnog učenja koji se koriste za razdvajanje proizvoljnih miješanih zvukova u njihove pojedinačne komponente. Također je objavljen generički model dubokog strojnog učenja (TDCN++) koji se može koristiti u Tensorflowu za odvajanje zvukova. Podaci pripremljeni na temelju zbirke freesound.org и Objavljeno licencirano pod CC BY 4.0.

Predstavljeni projekt FUSS (Free Universal Sound Separation) usmjeren je na rješavanje problema razdvajanja bilo kojeg broja proizvoljnih zvukova, čija priroda nije unaprijed poznata. Drugi slični sustavi općenito su ograničeni na zadatak razlikovanja određenih zvukova, poput glasova i neglasova, ili različitih ljudi koji govore.

Baza podataka sadrži oko 20 tisuća miješanja. Komplet također uključuje unaprijed izračunate impulsne odzive prostorije korištenjem prilagođenog simulatora prostorije koji uzima u obzir refleksiju zida, lokaciju izvora zvuka i lokaciju mikrofona.

Izvor: opennet.ru

Dodajte komentar