Usasishaji wa Sauti ya Mozilla 12.0

Mozilla imesasisha seti zake za data za Sauti ya Kawaida ili kujumuisha sampuli za matamshi kutoka kwa zaidi ya watu 200. Data inachapishwa kama kikoa cha umma (CC0). Seti zinazopendekezwa zinaweza kutumika katika mifumo ya kujifunza kwa mashine ili kujenga utambuzi wa usemi na miundo ya usanisi.

Ikilinganishwa na sasisho la awali, kiasi cha nyenzo za hotuba katika mkusanyiko kiliongezeka kutoka 23.8 hadi 25.8 za hotuba. Zaidi ya watu elfu 88 walishiriki katika utayarishaji wa vifaa kwa Kiingereza, wakiamuru masaa 3161 ya hotuba (kulikuwa na washiriki elfu 84 na masaa 3098). Seti ya lugha ya Kibelarusi inashughulikia washiriki 7903 na masaa 1419 ya nyenzo za hotuba (kulikuwa na washiriki 6965 na masaa 1217), Kirusi - washiriki 2815 na masaa 229 (kulikuwa na washiriki 2731 na masaa 215), Uzbek - masaa 2092 na washiriki 262. kulikuwa na washiriki 2025 na masaa 258), lugha ya Kiukreni - washiriki 780 na masaa 87 (kulikuwa na washiriki 759 na masaa 87).

Mradi wa Sauti ya Kawaida unalenga kupanga kazi ya pamoja ili kukusanya hifadhidata ya mifumo ya sauti ambayo inazingatia utofauti wa sauti na mitindo ya usemi. Watumiaji wanaalikwa kutoa vifungu vya sauti vinavyoonyeshwa kwenye skrini au kutathmini ubora wa data iliyoongezwa na watumiaji wengine. Hifadhidata iliyokusanywa yenye rekodi za matamshi mbalimbali ya vishazi vya kawaida vya usemi wa binadamu inaweza kutumika bila vikwazo katika mifumo ya kujifunza kwa mashine na katika miradi ya utafiti.

Chanzo: opennet.ru

Kuongeza maoni