Mozilla hà publicatu una aghjurnazione à i so datasets di Common Voice, chì includenu campioni di pronuncia da quasi 200 0 persone. I dati sò publicati cum'è duminiu publicu (CCXNUMX). I setti pruposti ponu esse aduprati in sistemi d'apprendimentu automaticu per custruisce mudelli di ricunniscenza è sintesi vocale.
In cunfrontu cù l'aghjurnamentu precedente, u voluminu di materiale di parlà in a cullizzioni hè aumentatu da 10% - da 18.2 à 20.2 mila ore di parlà. U numaru di lingue supportate hè aumentatu da 87 à 93. Per 27 lingue, più di 100 ore di dati di parlà sò stati accumulati, è per 9 - più di 500 ore di dati di parlà. Per 9 lingue era ancu pussibule di ottene una parte di u discorsu femminile di almenu 45%.
Più di 81 mila persone anu participatu à a preparazione di materiali in inglese, dettandu 2953 ore di discorsu (ci era 79 mila participanti è 2886 ore). U settore per a lingua bielorussa copre 6326 participanti è 1054 ore di materiale di parlà (ci era 6160 participanti è 987 ore), russu - 2585 participanti è 201 ore (ci era 2452 participanti è 193 ore), Uzbek - 1503 participanti è 231 ore ( ci era 1355 participanti è 227 ore), lingua ucraina - 696 participanti è 79 ore (ci era 684 participanti è 76 ore).
U prughjettu Common Voice hà u scopu di urganizà u travagliu cumunu per accumulà una basa di dati di mudelli di voce chì tene in contu a diversità di voci è stili di parlà. L'utilizatori sò invitati à e frasi di voce affissate nantu à u screnu o valutà a qualità di e dati aghjuntu da altri utilizatori. A basa di dati accumulata cù registri di diverse pronunce di frasi tipiche di u discorsu umanu pò esse aduprata senza restrizioni in sistemi di apprendimentu machine è in prughjetti di ricerca.
Source: opennet.ru
