گوگل آوازوں کو الگ کرنے کے لیے ڈیٹا اور مشین لرننگ ماڈل جاری کرتا ہے۔

گوگل опубликовала حوالہ مخلوط آوازوں کا ایک تشریح شدہ ڈیٹا بیس جو مشین لرننگ سسٹمز میں استعمال کیا جا سکتا ہے جو صوابدیدی مخلوط آوازوں کو ان کے انفرادی اجزاء میں الگ کرنے کے لیے استعمال کیا جاتا ہے۔ ایک عام ڈیپ مشین لرننگ ماڈل (TDCN++) بھی شائع کیا گیا ہے جسے Tensorflow میں آوازوں کو الگ کرنے کے لیے استعمال کیا جا سکتا ہے۔ جمع کی بنیاد پر ڈیٹا تیار کیا گیا ہے۔ freesound.org и شائع ہوا CC BY 4.0 کے تحت لائسنس یافتہ۔

پیش کردہ پراجیکٹ FUSS (مفت یونیورسل ساؤنڈ سیپریشن) کا مقصد کسی بھی قسم کی صوابدیدی آوازوں کو الگ کرنے کے مسئلے کو حل کرنا ہے، جس کی نوعیت پہلے سے معلوم نہیں ہے۔ دوسرے اسی طرح کے نظام عام طور پر کچھ آوازوں، جیسے آوازوں اور غیر آوازوں، یا مختلف لوگوں کے بولنے کے درمیان فرق کرنے کے کام تک محدود ہیں۔

ڈیٹا بیس میں تقریباً 20 ہزار مکسنگز ہیں۔ اس کٹ میں حسب ضرورت بنائے گئے کمرے کے سمیلیٹر کا استعمال کرتے ہوئے پہلے سے کیلکولیٹ شدہ کمرے کے تسلسل کے جوابات بھی شامل ہیں جو دیوار کی عکاسی، آواز کے ماخذ کی جگہ، اور مائیکروفون کی جگہ کو مدنظر رکھتے ہیں۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں