Google tirrilaxxa data u mudell ta' tagħlim tal-magni biex tissepara l-ħsejjes

Google ippubblikat database annotata ta’ ħsejjes imħallta ta’ referenza li jistgħu jintużaw f’sistemi ta’ tagħlim bil-magni użati biex jisseparaw ħsejjes imħallta arbitrarji fil-komponenti individwali tagħhom. Ġie ppubblikat ukoll mudell ġeneriku ta’ tagħlim tal-magni fil-fond (TDCN++) li jista’ jintuża f’Tensorflow biex jissepara l-ħsejjes. Data ppreparata abbażi tal-ġbir freesound.org и ippubblikat liċenzjat taħt CC BY 4.0.

Il-proġett ippreżentat FUSS (Free Universal Sound Separation) huwa mmirat biex isolvi l-problema tas-separazzjoni ta 'kull numru ta' ħsejjes arbitrarji, li n-natura tagħhom mhix magħrufa minn qabel. Sistemi simili oħra huma ġeneralment limitati għall-kompitu li jiddistingwu bejn ċerti ħsejjes, bħal vuċijiet u mhux vuċijiet, jew nies differenti li jitkellmu.

Id-database fiha madwar 20 elf taħlit. Il-kit jinkludi wkoll risponsi ta 'impuls tal-kamra kkalkulati minn qabel bl-użu ta' simulatur tal-kamra mibni apposta li jqis ir-riflessjoni tal-ħajt, il-post tas-sors tal-ħoss, u l-post tal-mikrofonu.

Sors: opennet.ru

Żid kumment