Inilabas ng Google ang data at modelo ng machine learning para magkahiwalay ang mga tunog

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° isang naka-annotate na database ng mga sanggunian na pinaghalong tunog na maaaring gamitin sa mga machine learning system na ginagamit upang paghiwalayin ang mga di-makatwirang halo-halong tunog sa kanilang mga indibidwal na bahagi. Na-publish din ang isang generic na deep machine learning model (TDCN++) na magagamit sa Tensorflow upang paghiwalayin ang mga tunog. Inihanda ang datos batay sa koleksyon freesound.org ΠΈ nalathala lisensyado sa ilalim ng CC BY 4.0.

Ang ipinakita na proyektong FUSS (Free Universal Sound Separation) ay naglalayong lutasin ang problema ng paghihiwalay ng anumang bilang ng mga di-makatwirang tunog, ang likas na katangian nito ay hindi alam nang maaga. Ang iba pang katulad na mga sistema ay karaniwang limitado sa gawain ng pagkilala sa pagitan ng ilang partikular na tunog, gaya ng mga boses at hindi boses, o iba't ibang taong nagsasalita.

Ang database ay naglalaman ng halos 20 libong paghahalo. Kasama rin sa kit ang pre-calculated room impulse responses gamit ang custom-built room simulator na isinasaalang-alang ang wall reflection, sound source location, at microphone location.

Pinagmulan: opennet.ru

Magdagdag ng komento