גוגל פורסם גם מאגר נתונים של צלילים מעורבים, עם הערות, שניתן להשתמש בהם במערכות למידת מכונה להפרדת צלילים מעורבים שרירותיים לרכיבים האינדיבידואליים שלהם. מודל למידה עמוקה למטרות כלליות (TDCN++) שניתן להשתמש בו ב-Tensorflow להפרדת צלילים. הנתונים מבוססים על האוסף и מורשה תחת CC BY 4.0.
פרויקט FUSS (הפרדת צלילים אוניברסלית חופשית) המוצג שואף לפתור את בעיית ההפרדה של מספר רב של צלילים שרירותיים שטבעם אינו ידוע מראש. מערכות דומות אחרות מוגבלות בדרך כלל להפרדת צלילים ספציפיים, כגון קולות וצלילים שאינם קוליים, או דוברים שונים.
מסד הנתונים מכיל כ-20 תערובות. הערכה כוללת גם תגובות אימפולס מחושבות מראש של החדר, שנוצרו באמצעות סימולטור חדר שנוצר במיוחד תוך התחשבות בהשתקפויות קירות, מיקום מקור הקול ומיקום המיקרופון.
מקור: OpenNet.ru
