Mozilla 更新了其 Common Voice 資料集,其中包括來自 200 多人的發音樣本。數據在公共領域(CC0)發布。所提出的集合可用於機器學習系統來建立語音辨識和合成模型。與上次更新相比,該合集的語音材料量從31.1萬小時增加到31.8萬小時,其中20.8萬小時已通過驗證程序。支援的語言數量從124種增加到129種(添加了非洲部落科薩語、卡倫金語、基達維達語、多洛語和茨瓦納語)。
參加英文資料編寫的人員達93.3萬人,口述演講3554小時(實際參與人數92.3萬人,3508小時)。白俄羅斯語的試卷涵蓋了 8400 名參與者和 1815 小時的演講材料(共有 8291 名參與者和 1766 小時);俄語的試卷涵蓋了 3241 名參與者和 277 小時(共有 3206 名參與者和 274 小時);烏茲別克語的試卷涵蓋了 2189 265 2170 264 1091 小時 113 1075 小時共有 112 XNUMX 小時和 XNUMX XNUMX 小時。 XNUMX 小時);烏克蘭語的試卷涵蓋了 XNUMX 名參與者和 XNUMX 小時(共有 XNUMX 名參與者和 XNUMX 小時)。
Common Voice 計畫旨在組織共同工作,累積考慮聲音和言語風格多樣性的聲音模式資料庫。 用戶被邀請說出螢幕上顯示的語音短語或評估其他用戶添加的數據的品質。 記錄了人類語音典型短語的各種發音的累積資料庫可以在機器學習系統和研究項目中不受限制地使用。
來源: opennet.ru
