Mozilla Common Voice 18.0 Atualização de voz

A Mozilla atualizou seus conjuntos de dados Common Voice para incluir amostras de pronúncia de mais de 200 pessoas. Os dados são publicados como domínio público (CC0). Os conjuntos propostos podem ser utilizados em sistemas de aprendizado de máquina para construir modelos de reconhecimento e síntese de fala. Em comparação com a atualização anterior, o volume de material de fala do acervo passou de 31.1 para 31.8 mil horas de fala, das quais 20.8 mil horas passaram pelo procedimento de verificação. O número de línguas suportadas aumentou de 124 para 129 (foram adicionadas as línguas das tribos africanas Xhosa, Kalenjin, Kidawida, Doluo e Tswana).

93.3 mil pessoas participaram da elaboração dos materiais em inglês, ditando 3554 horas de fala (foram 92.3 mil participantes e 3508 horas). O conjunto para a língua bielorrussa abrange 8400 participantes e 1815 horas de material de fala (foram 8291 participantes e 1766 horas), russo - 3241 participantes e 277 horas (foram 3206 participantes e 274 horas), uzbeque - 2189 participantes e 265 horas ( foram 2170 participantes e 264 horas), língua ucraniana - 1091 participantes e 113 horas (foram 1075 participantes e 112 horas).

O projeto Common Voice visa organizar um trabalho conjunto para acumular uma base de dados de padrões de voz que leve em conta a diversidade de vozes e estilos de fala. Os usuários são convidados a expressar frases exibidas na tela ou avaliar a qualidade dos dados adicionados por outros usuários. O banco de dados acumulado com registros de diversas pronúncias de frases típicas da fala humana pode ser utilizado sem restrições em sistemas de aprendizado de máquina e em projetos de pesquisa.

Fonte: opennet.ru

Compre hospedagem confiável para sites com proteção DDoS, servidores VPS VDS 🔥 Compre hospedagem de sites confiável com proteção contra DDoS, servidores VPS/VDS | ProHoster