Mozilla Common Voice 12.0 Update

Mozilla hà aghjurnatu i so datasets di Common Voice per include mostre di pronuncia da più di 200 0 persone. I dati sò publicati cum'è duminiu publicu (CCXNUMX). I setti pruposti ponu esse aduprati in sistemi d'apprendimentu automaticu per custruisce mudelli di ricunniscenza è sintesi vocale.

In cunfrontu cù l'aghjurnamentu precedente, u voluminu di materiale di parlà in a cullizzioni hà aumentatu da 23.8 à 25.8 mila ore di discorsu. Più di 88 mila persone anu participatu à a preparazione di materiali in inglese, dictating 3161 ore di discorsu (ci era 84 mila participanti è 3098 ore). U settore per a lingua bielorussa copre 7903 participanti è 1419 ore di materiale di parlà (ci era 6965 participanti è 1217 ore), Russian - 2815 participanti è 229 ore (ci era 2731 participanti è 215 ore), Uzbek - 2092 participanti è 262 ore ( ci era 2025 participanti è 258 ore), lingua ucraina - 780 participanti è 87 ore (ci era 759 participanti è 87 ore).

U prughjettu Common Voice hà u scopu di urganizà u travagliu cumunu per accumulà una basa di dati di mudelli di voce chì tene in contu a diversità di voci è stili di parlà. L'utilizatori sò invitati à e frasi di voce affissate nantu à u screnu o valutà a qualità di e dati aghjuntu da altri utilizatori. A basa di dati accumulata cù registri di diverse pronunce di frasi tipiche di u discorsu umanu pò esse aduprata senza restrizioni in sistemi di apprendimentu machine è in prughjetti di ricerca.

Source: opennet.ru

Add a comment