A Google kiadja az adatokat és a gépi tanulási modellt a hangok elkülönítésére

Google közzétett a kevert referenciahangok megjegyzésekkel ellátott adatbázisa, amely felhasználható olyan gépi tanulási rendszerekben, amelyek tetszőleges kevert hangok egyedi összetevőire való szétválasztására szolgálnak. Megjelent egy általános mélygépi tanulási modell (TDCN++), amely Tensorflow-ban használható hangok szétválasztására. A gyűjtés alapján elkészített adatok freesound.org и közzétett a CC BY 4.0 szerint engedélyezett.

A bemutatott FUSS (Free Universal Sound Separation) projekt célja, hogy megoldja a tetszőleges számú tetszőleges hang elválasztásának problémáját, amelyek természete előre nem ismert. Más hasonló rendszerek általában arra a feladatra korlátozódnak, hogy különbséget tegyenek bizonyos hangok, például hangok és nem hangok, vagy különböző beszélő emberek között.

Az adatbázis mintegy 20 ezer keverést tartalmaz. A készlet előre kiszámított szobai impulzusválaszokat is tartalmaz egy egyedileg épített szobaszimulátor segítségével, amely figyelembe veszi a fal visszaverődését, a hangforrás helyét és a mikrofon helyét.

Forrás: opennet.ru

Hozzászólás