تُصدر Google البيانات ونموذج التعلم الآلي لتقسيم الأصوات

متصفح الجوجل опубликовала قاعدة بيانات صوتية مدمجة مرجعية مشروحة يمكن استخدامها في أنظمة التعلم الآلي المستخدمة لفصل الأصوات الممزوجة العشوائية إلى مكونات فردية. كما تم نشر نموذج عام للتعلم العميق (TDCN ++) يمكن استخدامه في Tensorflow لفصل الأصوات. أعدت البيانات على أساس الجمع freesound.org и نشرت مرخصة بموجب CCBY 4.0.

يهدف المشروع المقدم FUSS (Free Universal Sound Separation) إلى حل مشكلة فصل أي عدد من الأصوات العشوائية ، والتي لا تعرف طبيعتها مسبقًا. تقتصر هذه الأنظمة الأخرى بشكل عام على مهمة فصل أصوات معينة ، مثل الأصوات وغير الأصوات ، أو الأشخاص الناطقين المختلفين.

تحتوي قاعدة البيانات على حوالي 20 ألف مزيج. يشتمل الجناح أيضًا على استجابات دافعة محسوبة مسبقًا للغرفة تم إعدادها باستخدام جهاز محاكاة غرفة مصمم خصيصًا يأخذ في الاعتبار انعكاسات الحائط وموقع مصدر الصوت وموقع الميكروفون.

المصدر: opennet.ru

إضافة تعليق