Google-k datuak eta ikaskuntza automatikoaren eredua kaleratzen ditu soinuak bereizteko

Google argitaratuko erreferentziazko soinu nahasien datu-base ohartatua, nahastutako soinu arbitrarioak bere osagai indibidualetan bereizteko erabiltzen diren ikasketa automatikoko sistemetan erabil daitekeena. Ikasketa automatiko sakoneko eredu generiko bat (TDCN++) ere argitaratu da, soinuak bereizteko Tensorflow-en erabil daitekeena. Bildumaren arabera prestatutako datuak freesound.org ΠΈ argitaratua CC BY 4.0 lizentziapean.

Aurkeztutako FUSS (Free Universal Sound Separation) proiektuak edozein soinu arbitrario bereizteko arazoa konpontzera zuzenduta dago, zeinen izaera aldez aurretik ezagutzen ez den. Antzeko beste sistema batzuk, oro har, soinu jakin batzuk bereizteko zereginera mugatzen dira, hala nola, ahotsak eta ez-ahotsak, edo hitz egiten duten pertsona desberdinak.

Datu-baseak 20 mila nahasketa inguru ditu. Kitak aurrez kalkulatutako gela-bulkada-erantzunak ere barne hartzen ditu, hormaren isla, soinu-iturriaren kokapena eta mikrofonoaren kokapena kontuan hartzen dituen neurrira eraikitako gela-simulatzaile baten bidez.

Iturria: opennet.ru

Gehitu iruzkin berria