گوگل آوازن کي الڳ ڪرڻ لاءِ ڊيٽا ۽ مشين لرننگ ماڊل جاري ڪري ٿو

گوگل شايع ٿيل ريفرنس مليل آوازن جو هڪ تشريح ڪيل ڊيٽابيس جيڪو مشين لرننگ سسٽم ۾ استعمال ڪري سگهجي ٿو جيڪي استعمال ٿيل خودمختيار مخلوط آوازن کي انهن جي انفرادي حصن ۾ الڳ ڪرڻ لاءِ. ھڪڙو عام ڊيپ مشين لرننگ ماڊل (TDCN++) پڻ شايع ڪيو ويو آھي جيڪو آوازن کي الڳ ڪرڻ لاءِ Tensorflow ۾ استعمال ڪري سگھجي ٿو. ڊيٽا گڏ ڪرڻ جي بنياد تي تيار ڪيل freesound.org и شايع ٿيل CC BY 4.0 تحت لائسنس يافته.

پيش ڪيل پروجيڪٽ FUSS (مفت يونيورسل سائونڊ سيپريشن) جو مقصد ڪنهن به قسم جي صوابديدي آوازن کي الڳ ڪرڻ جي مسئلي کي حل ڪرڻ آهي، جنهن جي نوعيت اڳ ۾ معلوم نه آهي. ٻيا ساڳيا نظام عام طور تي مخصوص آوازن جي وچ ۾ فرق ڪرڻ جي ڪم تائين محدود آهن، جهڙوڪ آواز ۽ غير آواز، يا مختلف ماڻهو ڳالهائيندڙ.

ڊيٽابيس ۾ اٽڪل 20 هزار ميلاپ شامل آهن. ڪِٽ ۾ اڳواٽ حساب ڪيل ڪمرو امپلس جواب به شامل آهن هڪ ڪسٽم-بلٽ روم سموليٽر استعمال ڪندي جيڪو حساب ۾ رکي ٿو ڀت جي عڪاسي، آواز جي ماخذ جي جڳهه، ۽ مائڪروفون جي جڳهه.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو