Google ngeculake data lan model pembelajaran mesin kanggo misahake swara

Google diterbitake database annotated saka referensi swara campuran sing bisa digunakake ing sistem learning machine digunakake kanggo misahake swara campuran sembarang menyang komponen individu. Model pembelajaran mesin jero umum (TDCN ++) uga wis diterbitake sing bisa digunakake ing Tensorflow kanggo misahake swara. Data disiapake adhedhasar koleksi freesound.org ΠΈ diterbitake dilisensi miturut CC BY 4.0.

Proyek sing diwenehi FUSS (Free Universal Sound Separation) ditujokake kanggo ngrampungake masalah pamisahan swara sing sewenang-wenang, sing sifate ora dingerteni sadurunge. Sistem liyane sing padha umume diwatesi kanggo mbedakake antarane swara tartamtu, kayata swara lan non-swara, utawa wong liya sing ngomong.

Database ngemot babagan 20 ewu campuran. Kit kasebut uga kalebu tanggapan impuls kamar sing wis diwilang kanthi nggunakake simulator kamar sing digawe khusus sing njupuk refleksi tembok, lokasi sumber swara, lan lokasi mikropon.

Source: opennet.ru

Add a comment