Actualización de voz de Mozilla Common Voice 9.0

Mozilla ha publicado una actualización de sus conjuntos de datos de Common Voice, que incluyen muestras de pronunciación de casi 200 personas. Los datos se publican como dominio público (CC0). Los conjuntos propuestos se pueden utilizar en sistemas de aprendizaje automático para construir modelos de síntesis y reconocimiento de voz.

En comparación con la actualización anterior, el volumen de material de discursos de la colección aumentó en un 10%: de 18.2 a 20.2 mil horas de discursos. La cantidad de idiomas admitidos ha aumentado de 87 a 93. Para 27 idiomas, se han acumulado más de 100 horas de datos de voz y para 9, más de 500 horas de datos de voz. Para 9 idiomas también se logró alcanzar una proporción de habla femenina de al menos el 45%.

En la preparación de los materiales en inglés participaron más de 81 mil personas, dictando 2953 horas de discurso (fueron 79 mil participantes y 2886 horas). El conjunto de idioma bielorruso cubre 6326 participantes y 1054 horas de material oral (hubo 6160 participantes y 987 horas), ruso - 2585 participantes y 201 horas (hubo 2452 participantes y 193 horas), uzbeko - 1503 participantes y 231 horas ( hubo 1355 participantes y 227 horas), idioma ucraniano: 696 participantes y 79 horas (hubo 684 participantes y 76 horas).

El proyecto Common Voice tiene como objetivo organizar un trabajo conjunto para acumular una base de datos de patrones de voz que tenga en cuenta la diversidad de voces y estilos de habla. Se invita a los usuarios a expresar frases que se muestran en la pantalla o evaluar la calidad de los datos agregados por otros usuarios. La base de datos acumulada con registros de diversas pronunciaciones de frases típicas del habla humana se puede utilizar sin restricciones en sistemas de aprendizaje automático y en proyectos de investigación.

Fuente: opennet.ru

Añadir un comentario