Google дыбыстарды бөлу үшін деректер мен машиналық оқыту үлгісін шығарады

Google жарияланған ерікті аралас дыбыстарды жеке құрамдас бөліктерге бөлу үшін пайдаланылатын машиналық оқыту жүйелерінде пайдалануға болатын анықтамалық аралас дыбыстардың аннотацияланған дерекқоры. Сондай-ақ дыбыстарды бөлу үшін Tensorflow бағдарламасында қолдануға болатын терең машиналық оқытудың жалпы үлгісі (TDCN++) жарияланды. Жинақ негізінде дайындалған деректер freesound.org и жарияланған CC BY 4.0 бойынша лицензияланған.

Ұсынылған FUSS жобасы (Free Universal Sound Separation) табиғаты алдын ала белгісіз кез келген еркін дыбыстарды бөлу мәселесін шешуге бағытталған. Басқа ұқсас жүйелер әдетте белгілі бір дыбыстарды, мысалы, дауыстар мен дауыссыз дыбыстарды немесе әртүрлі адамдардың сөйлейтінін ажырату міндетімен шектеледі.

Деректер базасында шамамен 20 мың араластыру бар. Жинақ сонымен қатар қабырғаның шағылысуын, дыбыс көзінің орналасуын және микрофонның орналасуын ескеретін тапсырыс бойынша құрастырылған бөлме симуляторы арқылы алдын ала есептелген бөлме импульсінің жауаптарын қамтиды.

Ақпарат көзі: opennet.ru

пікір қалдыру