Mozilla Common Voice 9.0 语音更新

Mozilla 发布了通用语音数据集的更新,其中包括来自近 200 人的发音样本。 该数据作为公共领域 (CC0) 发布。 所提出的集合可用于机器学习系统来构建语音识别和合成模型。

与之前的更新相比,集合中的演讲材料量增加了 10%——从 18.2 万小时增加到 20.2 万小时。 支持的语言数量从87种增加到93种。其中27种语言积累了超过100小时的语音数据,9种语言积累了超过500小时的语音数据。 对于 9 种语言,女性发言比例也有可能达到至少 45%。

超过81万人参与了英语材料的准备,口授演讲2953小时(参与人数79万人,2886小时)。 白俄罗斯语组涵盖 6326 名参与者和 1054 小时的演讲材料(有 6160 名参与者和 987 小时),俄语 - 2585 名参与者和 201 小时(有 2452 名参与者和 193 小时),乌兹别克语 - 1503 名参与者和 231 小时(有 1355 名参与者和 227 小时),乌克兰语 - 696 名参与者和 79 小时(有 684 名参与者和 76 小时)。

Common Voice 项目旨在组织联合工作,积累考虑声音和言语风格多样性的声音模式数据库。 用户被邀请说出屏幕上显示的语音短语或评估其他用户添加的数据的质量。 记录了人类语音典型短语的各种发音的累积数据库可以在机器学习系统和研究项目中不受限制地使用。

来源: opennet.ru

添加评论