Pembaruan Suara Mozilla Common Voice 9.0

Mozilla telah merilis pembaruan pada kumpulan data Common Voice, yang mencakup sampel pengucapan dari hampir 200 orang. Data dipublikasikan sebagai domain publik (CC0). Kumpulan yang diusulkan dapat digunakan dalam sistem pembelajaran mesin untuk membangun model pengenalan dan sintesis ucapan.

Dibandingkan pembaruan sebelumnya, volume materi pidato dalam koleksi meningkat 10% - dari 18.2 menjadi 20.2 ribu jam pidato. Jumlah bahasa yang didukung telah meningkat dari 87 menjadi 93. Untuk 27 bahasa, lebih dari 100 jam data ucapan telah terakumulasi, dan untuk 9 bahasa, lebih dari 500 jam data ucapan. Untuk 9 bahasa juga dimungkinkan untuk mencapai pangsa tuturan perempuan minimal 45%.

Lebih dari 81 ribu orang mengikuti penyiapan materi dalam bahasa Inggris, mendiktekan 2953 jam pidato (ada 79 ribu peserta dan 2886 jam). Set untuk bahasa Belarusia mencakup 6326 peserta dan 1054 jam materi pidato (ada 6160 peserta dan 987 jam), Rusia - 2585 peserta dan 201 jam (ada 2452 peserta dan 193 jam), Uzbekistan - 1503 peserta dan 231 jam ( ada 1355 peserta dan 227 jam), bahasa Ukraina - 696 peserta dan 79 jam (ada 684 peserta dan 76 jam).

Proyek Common Voice bertujuan untuk mengatur kerja sama untuk mengumpulkan database pola suara yang memperhitungkan keragaman suara dan gaya bicara. Pengguna diundang untuk menyuarakan frasa yang ditampilkan di layar atau mengevaluasi kualitas data yang ditambahkan oleh pengguna lain. Akumulasi database dengan catatan berbagai pengucapan frasa khas ucapan manusia dapat digunakan tanpa batasan dalam sistem pembelajaran mesin dan proyek penelitian.

Sumber: opennet.ru

Tambah komentar