Mozilla Common Voice 12.0 Aggiornamento vocale

Mozilla ha aggiornato i suoi set di dati Common Voice per includere campioni di pronuncia di oltre 200 persone. I dati sono pubblicati come dominio pubblico (CC0). I set proposti possono essere utilizzati nei sistemi di apprendimento automatico per costruire modelli di riconoscimento e sintesi vocale.

Rispetto all'aggiornamento precedente, il volume del materiale vocale nella raccolta è aumentato da 23.8 a 25.8 mila ore di discorso. Alla preparazione dei materiali in lingua inglese hanno preso parte più di 88mila persone, dettando 3161 ore di discorso (sono stati 84mila i partecipanti e 3098 ore). Il set per la lingua bielorussa copre 7903 partecipanti e 1419 ore di materiale vocale (c'erano 6965 partecipanti e 1217 ore), russo - 2815 partecipanti e 229 ore (c'erano 2731 partecipanti e 215 ore), uzbeko - 2092 partecipanti e 262 ore ( c'erano 2025 partecipanti e 258 ore), lingua ucraina - 780 partecipanti e 87 ore (c'erano 759 partecipanti e 87 ore).

Il progetto Common Voice mira a organizzare un lavoro congiunto per accumulare un database di modelli vocali che tenga conto della diversità delle voci e degli stili linguistici. Gli utenti sono invitati a pronunciare le frasi visualizzate sullo schermo o a valutare la qualità dei dati aggiunti da altri utenti. Il database accumulato con registrazioni di varie pronunce di frasi tipiche del linguaggio umano può essere utilizzato senza restrizioni nei sistemi di apprendimento automatico e nei progetti di ricerca.

Fonte: opennet.ru

Aggiungi un commento