Google tovushlarni ajratish uchun maʼlumotlar va mashinani oʻrganish modelini chiqaradi

Google e'lon qilindi ixtiyoriy aralash tovushlarni alohida komponentlarga ajratish uchun foydalaniladigan mashinani o'rganish tizimlarida ishlatilishi mumkin bo'lgan mos yozuvlar aralash tovushlarning izohli ma'lumotlar bazasi. Tensorflow-da tovushlarni ajratish uchun ishlatilishi mumkin bo'lgan chuqur mashinani o'rganishning umumiy modeli (TDCN++) ham nashr etildi. Ma'lumotlar yig'ish asosida tayyorlangan freesound.org и nashr etilgan CC BY 4.0 bo'yicha litsenziyalangan.

Taqdim etilgan FUSS loyihasi (Free Universal Sound Separation) tabiati oldindan ma'lum bo'lmagan har qanday miqdordagi ixtiyoriy tovushlarni ajratish muammosini hal qilishga qaratilgan. Boshqa shunga o'xshash tizimlar odatda ma'lum tovushlarni, masalan, ovozli va ovozsiz tovushlarni yoki turli odamlarning so'zlashuvini farqlash vazifasi bilan cheklangan.

Ma'lumotlar bazasida 20 mingga yaqin aralashmalar mavjud. To'plam shuningdek, devorning aksini, tovush manbasining joylashishini va mikrofonning joylashishini hisobga oladigan maxsus qurilgan xona simulyatori yordamida oldindan hisoblangan xona impuls javoblarini o'z ichiga oladi.

Manba: opennet.ru

a Izoh qo'shish