Actualització de Mozilla Common Voice 12.0

Mozilla ha actualitzat els seus conjunts de dades de Common Voice per incloure mostres de pronunciació de més de 200 persones. Les dades es publiquen com a domini públic (CC0). Els conjunts proposats es poden utilitzar en sistemes d'aprenentatge automàtic per construir models de síntesi i reconeixement de veu.

En comparació amb l'actualització anterior, el volum de material de parla de la col·lecció va augmentar de 23.8 a 25.8 mil hores de parla. Més de 88 mil persones van participar en l'elaboració de materials en anglès, dictant 3161 hores de discurs (hi va haver 84 mil participants i 3098 hores). El conjunt per a l'idioma bielorús cobreix 7903 participants i 1419 hores de material de parla (hi va haver 6965 participants i 1217 hores), rus - 2815 participants i 229 hores (hi va haver 2731 participants i 215 hores), uzbek - 2092 participants i 262 hores ( hi va haver 2025 participants i 258 hores), llengua ucraïnesa - 780 participants i 87 hores (hi va haver 759 participants i 87 hores).

El projecte Common Voice pretén organitzar un treball conjunt per acumular una base de dades de patrons de veu que tingui en compte la diversitat de veus i estils de parla. Els usuaris estan convidats a frases de veu que es mostren a la pantalla o avaluar la qualitat de les dades afegides per altres usuaris. La base de dades acumulada amb registres de diverses pronunciacions de frases típiques de la parla humana es pot utilitzar sense restriccions en sistemes d'aprenentatge automàtic i en projectes de recerca.

Font: opennet.ru

Afegeix comentari