Google frigiver data- og maskinlæringsmodel til opdeling af lyde

Google опубликовала en kommenteret referencebaserede blandede lyde-database, der kan bruges i maskinlæringssystemer, der bruges til at adskille vilkårlige blandede lyde i individuelle komponenter. Der er også udgivet en generisk deep learning-model (TDCN++), der kan bruges i Tensorflow til at adskille lyde. Data udarbejdet på baggrund af indsamling freesound.org и udgivet licenseret under CCBY 4.0.

Det præsenterede projekt FUSS (Free Universal Sound Separation) har til formål at løse problemet med at adskille et vilkårligt antal vilkårlige lyde, hvis karakter ikke er kendt på forhånd. Andre sådanne systemer er generelt begrænset til opgaven med at adskille visse lyde, såsom stemmer og ikke-stemmer, eller forskellige talende personer.

Databasen indeholder omkring 20 tusinde blandinger. Suiten inkluderer også forudberegnede rumimpulsresponser forberedt med en specialbygget rumsimulator, der tager højde for vægrefleksioner, lydkildens placering og mikrofonens placering.

Kilde: opennet.ru

Tilføj en kommentar