Mozilla Common Voice 12.0 Voice Update

Mozilla on päivittänyt Common Voice -tietojoukonsa sisältämään yli 200 0 ihmisen ääntämisnäytteitä. Tiedot julkaistaan ​​julkisesti (CCXNUMX). Ehdotettuja sarjoja voidaan käyttää koneoppimisjärjestelmissä puheentunnistus- ja synteesimallien rakentamiseen.

Edelliseen päivitykseen verrattuna kokoelman puhemateriaalin määrä kasvoi 23.8:sta 25.8 tuhanteen puhetuntiin. Englanninkielisten materiaalien valmisteluun osallistui yli 88 tuhatta ihmistä, jotka sanelivat 3161 tuntia puhetta (osallistujia oli 84 tuhatta ja 3098 tuntia). Valkovenäjän kielen setti kattaa 7903 osallistujaa ja 1419 tuntia puhemateriaalia (osallistujia oli 6965 ja 1217 tuntia), venäjän - 2815 osallistujaa ja 229 tuntia (osallistujia oli 2731 ja 215 tuntia), uzbekin kielen - 2092 osallistujaa ja 262 tuntia ( osallistujia oli 2025 ja 258 tuntia), ukrainan kieli - 780 osallistujaa ja 87 tuntia (osallistujia oli 759 ja 87 tuntia).

Common Voice -hankkeen tavoitteena on järjestää yhteistä työtä äänimallien tietokannan keräämiseksi, joka ottaa huomioon äänien ja puhetyylien monimuotoisuuden. Käyttäjiä pyydetään kuuntelemaan näytöllä näkyviä lauseita tai arvioimaan muiden käyttäjien lisäämien tietojen laatua. Akkumuloitua tietokantaa, jossa on tietueita ihmisen puheen tyypillisten lauseiden eri ääntämismuodoista, voidaan käyttää rajoituksetta koneoppimisjärjestelmissä ja tutkimusprojekteissa.

Lähde: opennet.ru

Lisää kommentti