Google gefur út gagna- og vélnámslíkan til að aðskilja hljóð

Google опубликовала Gagnagrunnur með viðmiðunarhljóðum, með skýringum, sem hægt er að nota í vélanámskerfum til að aðgreina handahófskennd hljóð í einstaka þætti. Einnig hefur verið gefið út almennt djúpnámslíkan (TDCN++) sem hægt er að nota í Tensorflow til aðgreiningar hljóða. Gögnin byggjast á söfnuninni. freesound.org и birt Leyfisveitt undir CC BY 4.0.

FUSS verkefnið (Free Universal Sound Separation) sem hér er kynnt miðar að því að leysa vandamálið við að aðgreina ótal hljóð sem eru óþekkt fyrirfram. Önnur svipuð kerfi eru yfirleitt takmörkuð við að aðgreina tiltekin hljóð, svo sem raddir og hljóð sem eru ekki raddir, eða mismunandi hátalara.

Gagnagrunnurinn inniheldur um það bil 20 hljóðblöndur. Safnið inniheldur einnig fyrirfram útreiknaðar hljóðbylgjur í herbergjum, búnar til með sérhönnuðum herbergjahermi og tekur mið af endurspeglunum frá veggjum, staðsetningu hljóðgjafa og staðsetningu hljóðnema.

Heimild: opennet.ru