Gipagawas sa Google ang datos ug modelo sa pagkat-on sa makina alang sa pagbahin sa mga tunog

Google gipatik usa ka annotated nga database sa reperensiya nga nagkasagol nga mga tingog nga mahimong gamiton sa mga sistema sa pagkat-on sa makina nga gigamit sa pagbulag sa arbitraryong nagkasagol nga tingog ngadto sa ilang tagsa-tagsa ka mga sangkap. Usa ka generic deep machine learning model (TDCN++) ang gipatik usab nga magamit sa Tensorflow aron mabulag ang mga tingog. Giandam ang datos base sa pagkolekta freesound.org ΠΈ gimantala lisensyado ubos sa CC BY 4.0.

Ang gipresentar nga proyekto FUSS (Free Universal Sound Separation) gitumong sa pagsulbad sa problema sa pagbulag sa bisan unsa nga gidaghanon sa mga arbitraryong mga tingog, ang kinaiya nga wala mahibaloi daan. Ang uban nga susama nga mga sistema sa kasagaran limitado sa tahas sa pag-ila tali sa piho nga mga tunog, sama sa mga tingog ug dili mga tingog, o lainlaing mga tawo nga nagsulti.

Ang database naglangkob sa mga 20 ka libo nga pagsagol. Ang kit naglakip usab sa pre-calculated room impulse responses gamit ang custom-built room simulator nga nagkonsiderar sa wall reflection, sound source location, ug microphone location.

Source: opennet.ru

Idugang sa usa ka comment