Mozilla Common Voice 12.0 Atualização de voz

A Mozilla atualizou seus conjuntos de dados Common Voice para incluir amostras de pronúncia de mais de 200 pessoas. Os dados são publicados como domínio público (CC0). Os conjuntos propostos podem ser utilizados em sistemas de aprendizado de máquina para construir modelos de reconhecimento e síntese de fala.

Em comparação com a atualização anterior, o volume de material de fala do acervo passou de 23.8 para 25.8 mil horas de fala. Mais de 88 mil pessoas participaram da elaboração dos materiais em inglês, ditando 3161 horas de palestra (foram 84 mil participantes e 3098 horas). O conjunto para a língua bielorrussa abrange 7903 participantes e 1419 horas de material de fala (foram 6965 participantes e 1217 horas), russo - 2815 participantes e 229 horas (foram 2731 participantes e 215 horas), uzbeque - 2092 participantes e 262 horas ( foram 2025 participantes e 258 horas), língua ucraniana - 780 participantes e 87 horas (foram 759 participantes e 87 horas).

O projeto Common Voice visa organizar um trabalho conjunto para acumular uma base de dados de padrões de voz que leve em conta a diversidade de vozes e estilos de fala. Os usuários são convidados a expressar frases exibidas na tela ou avaliar a qualidade dos dados adicionados por outros usuários. O banco de dados acumulado com registros de diversas pronúncias de frases típicas da fala humana pode ser utilizado sem restrições em sistemas de aprendizado de máquina e em projetos de pesquisa.

Fonte: opennet.ru

Adicionar um comentário