Mozilla Common Voice 18.0 värskendus

Mozilla on värskendanud oma Common Voice'i andmekogumeid, et lisada hääldusnäidised enam kui 200 0 inimeselt. Andmed avaldatakse üldkasutatavana (CC31.1). Kavandatud komplekte saab kasutada masinõppesüsteemides kõnetuvastus- ja sünteesimudelite koostamiseks. Võrreldes eelmise uuendusega kasvas kogus oleva kõnematerjali maht 31.8 tuhandelt kõnetunnilt 20.8 tuhandele kõnetunnile, millest kontrolliprotseduuri läbis 124 tuhat tundi. Toetatud keelte arv on kasvanud 129-lt XNUMX-le (lisatud on Aafrika hõimude Xhosa, Kalenjin, Kidawida, Doluo ja Tswana keeled).

Ingliskeelsete materjalide koostamises osales 93.3 tuhat inimest, kes dikteerisid 3554 tundi kõnet (osalejaid oli 92.3 tuhat ja 3508 tundi). Valgevene keele komplekt hõlmab 8400 osalejat ja 1815 tundi kõnematerjali (osalejaid oli 8291 ja 1766 tundi), vene keele - 3241 osalejat ja 277 tundi (osalejaid oli 3206 ja 274 tundi), usbeki keele - 2189 osalejat ja 265 tundi ( osalejaid oli 2170 ja 264 tundi), ukraina keel - 1091 osalejat ja 113 tundi (osalejaid oli 1075 ja 112 tundi).

Projekti Common Voice eesmärk on korraldada ühistööd häälemustrite andmebaasi kogumiseks, mis arvestab häälte ja kõnestiilide mitmekesisusega. Kasutajaid kutsutakse hääldama ekraanil kuvatavaid fraase või hindama teiste kasutajate lisatud andmete kvaliteeti. Kogutud andmebaasi inimkõne tüüpiliste fraaside erinevate häälduste kirjetega saab piiranguteta kasutada masinõppesüsteemides ja uurimisprojektides.

Allikas: opennet.ru

Ostke DDoS-kaitsega saitide jaoks usaldusväärne hostimine, VPS VDS-serverid 🔥 Osta usaldusväärne veebimajutus DDoS-kaitsega, VPS VDS serverid | ProHoster