A Mozilla lançou uma atualização para seus conjuntos de dados Common Voice, que incluem amostras de pronúncia de quase 200 pessoas. Os dados são publicados como domínio público (CC0). Os conjuntos propostos podem ser utilizados em sistemas de aprendizado de máquina para construir modelos de reconhecimento e síntese de fala.
Em comparação com a atualização anterior, o volume de material de fala do acervo aumentou 10% - de 18.2 para 20.2 mil horas de fala. O número de idiomas suportados aumentou de 87 para 93. Para 27 idiomas, foram acumuladas mais de 100 horas de dados de fala e para 9 - mais de 500 horas de dados de fala. Para 9 línguas também foi possível atingir uma participação de fala feminina de pelo menos 45%.
Mais de 81 mil pessoas participaram da elaboração dos materiais em inglês, ditando 2953 horas de palestra (foram 79 mil participantes e 2886 horas). O conjunto para a língua bielorrussa abrange 6326 participantes e 1054 horas de material de fala (foram 6160 participantes e 987 horas), russo - 2585 participantes e 201 horas (foram 2452 participantes e 193 horas), uzbeque - 1503 participantes e 231 horas ( foram 1355 participantes e 227 horas), língua ucraniana - 696 participantes e 79 horas (foram 684 participantes e 76 horas).
O projeto Common Voice visa organizar um trabalho conjunto para acumular uma base de dados de padrões de voz que leve em conta a diversidade de vozes e estilos de fala. Os usuários são convidados a expressar frases exibidas na tela ou avaliar a qualidade dos dados adicionados por outros usuários. O banco de dados acumulado com registros de diversas pronúncias de frases típicas da fala humana pode ser utilizado sem restrições em sistemas de aprendizado de máquina e em projetos de pesquisa.
Fonte: opennet.ru
