Google publisearret gegevens- en masinelearmodel om lûden te skieden

Google publisearre in annotearre databank fan referinsje mingde lûden dy't kinne wurde brûkt yn masine learsystemen dy't brûkt wurde om willekeurige mingde lûden te skieden yn har yndividuele komponinten. In generysk model foar djippe masine learen (TDCN ++) is ek publisearre dat kin wurde brûkt yn Tensorflow om lûden te skieden. Gegevens taret op basis fan de kolleksje freesound.org и publisearre lisinsje ûnder CC BY 4.0.

It presintearre projekt FUSS (Free Universal Sound Separation) is rjochte op it oplossen fan it probleem fan it skieden fan in oantal willekeurige lûden, wêrfan de aard net fan tefoaren bekend is. Oare ferlykbere systemen binne oer it algemien beheind ta de taak om ûnderskied te meitsjen tusken bepaalde lûden, lykas stimmen en net-stimmen, of ferskillende minsken dy't prate.

De databank befettet sa'n 20 tûzen mingen. De kit omfettet ek foarberekkene keamerimpulsreaksjes mei in oanpaste keamersimulator dy't rekken hâldt mei muorrenrefleksje, lokaasje fan lûdboarne en mikrofoanlokaasje.

Boarne: opennet.ru

Add a comment