Google izlaiž datus un mašīnmācīšanās modeli, lai atdalītu skaņas

Google опубликовала anotēta atsauces jaukto skaņu datubāze, ko var izmantot mašīnmācīšanās sistēmās, ko izmanto, lai atdalītu patvaļīgas jauktas skaņas atsevišķos komponentos. Ir publicēts arī vispārējs dziļās mašīnmācīšanās modelis (TDCN++), ko var izmantot Tensorflow, lai atdalītu skaņas. Dati sagatavoti, pamatojoties uz apkopojumu freesound.org и publicēts licencēts saskaņā ar CC BY 4.0.

Piedāvātais projekts FUSS (Free Universal Sound Separation) ir vērsts uz jebkura skaita patvaļīgu skaņu atdalīšanas problēmu, kuru raksturs nav iepriekš zināms. Citas līdzīgas sistēmas parasti aprobežojas ar uzdevumu atšķirt noteiktas skaņas, piemēram, balsis un nebalsis, vai dažādus cilvēkus, kas runā.

Datu bāzē ir aptuveni 20 tūkstoši miksējumu. Komplektā ir iekļautas arī iepriekš aprēķinātas telpas impulsu reakcijas, izmantojot pielāgotu telpas simulatoru, kas ņem vērā sienas atstarojumu, skaņas avota atrašanās vietu un mikrofona atrašanās vietu.

Avots: opennet.ru

Pievieno komentāru