גוגל משחררת נתונים ומודל למידת מכונה כדי להפריד בין צלילים

גוגל опубликовала פורסם גם מאגר נתונים של צלילים מעורבים, עם הערות, שניתן להשתמש בהם במערכות למידת מכונה להפרדת צלילים מעורבים שרירותיים לרכיבים האינדיבידואליים שלהם. מודל למידה עמוקה למטרות כלליות (TDCN++) שניתן להשתמש בו ב-Tensorflow להפרדת צלילים. הנתונים מבוססים על האוסף freesound.org и יצא לאור מורשה תחת CC BY 4.0.

פרויקט FUSS (הפרדת צלילים אוניברסלית חופשית) המוצג שואף לפתור את בעיית ההפרדה של מספר רב של צלילים שרירותיים שטבעם אינו ידוע מראש. מערכות דומות אחרות מוגבלות בדרך כלל להפרדת צלילים ספציפיים, כגון קולות וצלילים שאינם קוליים, או דוברים שונים.

מסד הנתונים מכיל כ-20 תערובות. הערכה כוללת גם תגובות אימפולס מחושבות מראש של החדר, שנוצרו באמצעות סימולטור חדר שנוצר במיוחד תוך התחשבות בהשתקפויות קירות, מיקום מקור הקול ומיקום המיקרופון.

מקור: OpenNet.ru

קנה אירוח אמין לאתרים עם הגנת DDoS, שרתי VPS VDS 🔥 קנה אחסון אתרים אמין עם הגנת DDoS, שרתי VPS VDS | ProHoster