Google hutoa data na modeli ya kujifunza mashine ili kutenganisha sauti

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° hifadhidata iliyofafanuliwa ya sauti mchanganyiko zinazoweza kutumika katika mifumo ya kujifunza ya mashine inayotumika kutenganisha sauti mseto kiholela katika vijenzi vyake mahususi. Muundo wa jumla wa kujifunza mashine kwa kina (TDCN++) pia umechapishwa ambao unaweza kutumika katika Tensorflow kutenganisha sauti. Data iliyoandaliwa kulingana na mkusanyiko freesound.org ΠΈ iliyochapishwa iliyopewa leseni chini ya CC BY 4.0.

Mradi uliowasilishwa wa FUSS (Mgawanyiko wa Sauti ya Bure ya Universal) unalenga kutatua tatizo la kutenganisha idadi yoyote ya sauti za kiholela, asili ambayo haijulikani mapema. Mifumo mingine kama hiyo kwa ujumla ina ukomo wa kazi ya kutofautisha kati ya sauti fulani, kama vile sauti na zisizo za sauti, au watu tofauti wanaozungumza.

Hifadhidata ina takriban mchanganyiko elfu 20. Seti hii pia inajumuisha majibu yaliyohesabiwa awali ya msukumo wa chumba kwa kutumia kiigaji cha chumba kilichoundwa maalum ambacho huzingatia uakisi wa ukuta, eneo la chanzo cha sauti na eneo la maikrofoni.

Chanzo: opennet.ru

Kuongeza maoni