Update ng Mozilla Common Voice 12.0

Na-update ng Mozilla ang mga dataset ng Common Voice nito para magsama ng mga sample ng pagbigkas mula sa mahigit 200 tao. Ang data ay na-publish bilang pampublikong domain (CC0). Ang mga iminungkahing set ay maaaring gamitin sa mga machine learning system para bumuo ng speech recognition at synthesis models.

Kung ikukumpara sa nakaraang pag-update, ang dami ng materyal sa pagsasalita sa koleksyon ay tumaas mula 23.8 hanggang 25.8 libong oras ng pagsasalita. Mahigit sa 88 libong tao ang nakibahagi sa paghahanda ng mga materyales sa Ingles, na nagdidikta ng 3161 na oras ng pagsasalita (mayroong 84 libong kalahok at 3098 na oras). Ang hanay para sa wikang Belarusian ay sumasaklaw sa 7903 kalahok at 1419 na oras ng materyal sa pagsasalita (mayroong 6965 kalahok at 1217 oras), Russian - 2815 kalahok at 229 oras (mayroong 2731 kalahok at 215 oras), Uzbek - 2092 kalahok at 262 oras ( mayroong 2025 kalahok at 258 oras), wikang Ukrainian - 780 kalahok at 87 oras (mayroong 759 kalahok at 87 oras).

Ang proyekto ng Common Voice ay naglalayong ayusin ang magkasanib na gawain upang makaipon ng database ng mga pattern ng boses na isinasaalang-alang ang pagkakaiba-iba ng mga boses at istilo ng pagsasalita. Iniimbitahan ang mga user sa mga voice phrase na ipinapakita sa screen o suriin ang kalidad ng data na idinagdag ng ibang mga user. Ang naipon na database na may mga talaan ng iba't ibang pagbigkas ng mga tipikal na parirala ng pagsasalita ng tao ay maaaring gamitin nang walang mga paghihigpit sa mga machine learning system at sa mga proyekto ng pananaliksik.

Pinagmulan: opennet.ru

Magdagdag ng komento