Mozilla Common Voice 12.0 Voice Update

A Mozilla frissítette Common Voice adatkészleteit, hogy több mint 200 0 ember kiejtési mintáit tartalmazza. Az adatokat közkincsként (CCXNUMX) teszik közzé. A javasolt készletek gépi tanulási rendszerekben használhatók beszédfelismerési és szintézis modellek felépítésére.

Az előző frissítéshez képest a gyűjteményben található beszédanyag mennyisége 23.8-ról 25.8 ezer beszédórára nőtt. Az angol nyelvű anyagok elkészítésében több mint 88 ezren vettek részt, 3161 óra beszédet diktálva (84 ezer résztvevő és 3098 óra volt). A fehérorosz nyelvű készlet 7903 résztvevőt és 1419 órányi beszédanyagot takar (6965 résztvevő volt és 1217 óra), orosz nyelven 2815 résztvevő és 229 óra (2731 résztvevő és 215 óra), üzbég nyelven 2092 résztvevő és 262 óra ( 2025 résztvevő volt és 258 óra), ukrán nyelv - 780 résztvevő és 87 óra (759 résztvevő volt és 87 óra).

A Common Voice projekt célja közös munka megszervezése a hangminták adatbázisának felhalmozására, amely figyelembe veszi a hangok és beszédstílusok sokféleségét. A felhasználók felkérést kapnak a képernyőn megjelenő kifejezések hangzására vagy a más felhasználók által hozzáadott adatok minőségének értékelésére. Az emberi beszéd tipikus kifejezéseinek különféle kiejtését tartalmazó felhalmozott adatbázis korlátozások nélkül használható gépi tanulási rendszerekben és kutatási projektekben.

Forrás: opennet.ru

Hozzászólás