Google publikigas datumojn kaj maŝinlernmodelon por apartigi sonojn

Guglo eldonita komentita datumbazo de referenco miksitaj sonoj kiuj povas esti uzitaj en maŝinlernado sistemoj uzitaj por apartigi arbitrajn miksitajn sonojn en siajn individuajn komponentojn. Senmarka profunda maŝinlernado-modelo (TDCN++) ankaŭ estis publikigita kiu povas esti uzita en Tensorflow por apartigi sonojn. Datenoj preparitaj surbaze de la kolekto freesound.org и eldonita licencita sub CC BY 4.0.

La prezentita projekto FUSS (Free Universal Sound Separation) celas solvi la problemon de apartigo de ajna nombro da arbitraj sonoj, kies naturo ne estas anticipe konata. Aliaj similaj sistemoj estas ĝenerale limigitaj al la tasko distingi inter certaj sonoj, kiel voĉoj kaj ne-voĉoj, aŭ malsamaj homoj parolante.

La datumbazo enhavas ĉirkaŭ 20 mil miksaĵojn. La ilaro ankaŭ inkluzivas antaŭkalkulitajn ĉambrajn impulsrespondojn uzante specialkonstruitan ĉambran simulilon, kiu konsideras murreflekton, sonfontolokon kaj mikrofonan lokon.

fonto: opennet.ru

Aldoni komenton