Google stel data- en masjienleermodel vry om klanke te verdeel

Google gepubliseer 'n geannoteerde verwysing gemengde klankdatabasis wat gebruik kan word in masjienleerstelsels wat gebruik word om arbitrêre gemengde klanke in individuele komponente te skei. Ook gepubliseer is 'n generiese diep leermodel (TDCN++) wat in Tensorflow gebruik kan word om klanke te skei. Data voorberei op grond van versameling freesound.org и gepubliseer gelisensieer onder CCBY 4.0.

Die aangebied projek FUSS (Free Universal Sound Separation) is daarop gemik om die probleem op te los om enige aantal arbitrêre klanke te skei, waarvan die aard nie vooraf bekend is nie. Ander sulke stelsels is oor die algemeen beperk tot die taak om sekere klanke, soos stemme en nie-stemme, of verskillende sprekende mense te skei.

Die databasis bevat ongeveer 20 duisend mengsels. Die suite bevat ook voorafberekende kamerimpulsreaksies wat voorberei is met 'n pasgemaakte kamersimulator wat muurrefleksies, klankbronligging en mikrofoonligging in ag neem.

Bron: opennet.ru

Voeg 'n opmerking