Mozilla on päivittänyt Common Voice -tietojoukonsa sisältämään yli 200 0 ihmisen ääntämisnäytteitä. Tiedot julkaistaan julkisesti (CC31.8). Ehdotettuja sarjoja voidaan käyttää koneoppimisjärjestelmissä puheentunnistus- ja synteesimallien rakentamiseen. Edelliseen päivitykseen verrattuna kokoelman puhemateriaalin määrä kasvoi 32.6:sta 20 tuhanteen puhetuntiin, josta yli 129 tuhatta tuntia läpäisi varmennusmenettelyn. Tuettujen kielten määrä on kasvanut 131:stä XNUMX:een.
Englanninkielisten materiaalien valmisteluun osallistui 93.9 tuhatta ihmistä, jotka sanelivat 3587 tuntia puhetta (osallistujia oli 93.3 tuhatta ja tuntia 3554). Valkovenäjän kielen setti kattaa 8444 osallistujaa ja 1846 tuntia puhemateriaalia (osallistujia oli 8400 ja 1815 tuntia), venäjän - 3296 osallistujaa ja 278 tuntia (osallistujia oli 3241 ja 277 tuntia), uzbekin kielen - 2200 osallistujaa ja 265 tuntia ( osallistujia oli 2189 ja 265 tuntia), ukrainan kieli - 1104 osallistujaa ja 114 tuntia (osallistujia oli 1091 ja 113 tuntia).
Common Voice -hankkeen tavoitteena on järjestää yhteistä työtä äänimallien tietokannan keräämiseksi, joka ottaa huomioon äänien ja puhetyylien monimuotoisuuden. Käyttäjiä pyydetään kuuntelemaan näytöllä näkyviä lauseita tai arvioimaan muiden käyttäjien lisäämien tietojen laatua. Akkumuloitua tietokantaa, jossa on tietueita ihmisen puheen tyypillisten lauseiden eri ääntämismuodoista, voidaan käyttää rajoituksetta koneoppimisjärjestelmissä ja tutkimusprojekteissa.
Lähde: opennet.ru
