Actualización de voz de Mozilla Common Voice 12.0

Mozilla ha actualizado sus conjuntos de datos de Common Voice para incluir muestras de pronunciación de más de 200 personas. Los datos se publican como dominio público (CC0). Los conjuntos propuestos se pueden utilizar en sistemas de aprendizaje automático para construir modelos de síntesis y reconocimiento de voz.

En comparación con la actualización anterior, el volumen de material de discursos de la colección aumentó de 23.8 a 25.8 mil horas de discursos. En la elaboración de los materiales en inglés participaron más de 88 mil personas, dictando 3161 horas de discurso (fueron 84 mil participantes y 3098 horas). El conjunto de idioma bielorruso cubre 7903 participantes y 1419 horas de material oral (hubo 6965 participantes y 1217 horas), ruso - 2815 participantes y 229 horas (hubo 2731 participantes y 215 horas), uzbeko - 2092 participantes y 262 horas ( hubo 2025 participantes y 258 horas), idioma ucraniano: 780 participantes y 87 horas (hubo 759 participantes y 87 horas).

El proyecto Common Voice tiene como objetivo organizar un trabajo conjunto para acumular una base de datos de patrones de voz que tenga en cuenta la diversidad de voces y estilos de habla. Se invita a los usuarios a expresar frases que se muestran en la pantalla o evaluar la calidad de los datos agregados por otros usuarios. La base de datos acumulada con registros de diversas pronunciaciones de frases típicas del habla humana se puede utilizar sin restricciones en sistemas de aprendizaje automático y en proyectos de investigación.

Fuente: opennet.ru

Añadir un comentario