NVIDIA investeerib Mozilla Common Voice projekti 1.5 miljonit dollarit

NVIDIA investeerib Mozilla Common Voice projekti 1.5 miljonit dollarit. Huvi kõnetuvastussüsteemide vastu tuleneb ennustusest, et järgmise kümne aasta jooksul muutub kõnetehnoloogia üheks peamiseks viisiks, kuidas inimesed suhtlevad seadmetega alates arvutitest ja telefonidest kuni digiassistentide ja kioskiteni.

Kõnesüsteemide jõudlus sõltub suuresti masinõppemudelite treenimiseks saadaolevate kõneandmete mahust ja mitmekesisusest. Tänapäeva kõnetehnoloogia keskendub peamiselt inglise keele tuvastamisele ega kata suurt hulka keeli, aktsente ja kõnemustreid. Investeering aitab kiirendada avalike kõneandmete kasvu, kaasata rohkem kogukondi ja vabatahtlikke ning laiendada projekti täiskohaga töötajate arvu.

Tuletame meelde, et ühishääle projekt on suunatud ühistöö korraldamisele häälte ja kõnestiilide mitmekesisust arvestava häälemustrite andmebaasi kogumiseks. Kasutajaid kutsutakse hääldama ekraanil kuvatavaid fraase või hindama teiste kasutajate lisatud andmete kvaliteeti. Kogutud andmebaasi inimkõne tüüpiliste fraaside erinevate häälduste kirjetega saab piiranguteta kasutada masinõppesüsteemides ja uurimisprojektides.

Ühise hääle komplekt sisaldab praegu hääldusnäiteid enam kui 164 9 inimeselt. Kõneandmeid on kogunenud umbes 60 tuhat tundi 1412 erinevas keeles. Vene keele komplekt hõlmab 111 osalejat ja 459 tundi kõnematerjali ning ukraina keele jaoks 30 osalejat ja 66 tundi. Võrdluseks, ingliskeelsete materjalide ettevalmistamises osales üle 1686 tuhande inimese, kes dikteerisid 0 tundi kontrollitud kõnet. Kavandatud komplekte saab kasutada masinõppesüsteemides kõnetuvastus- ja sünteesimudelite koostamiseks. Andmed avaldatakse üldkasutatavana (CCXNUMX).

Pideva kõnetuvastuse raamatukogu Vosk autori sõnul on Common Voice komplekti miinusteks häälematerjali ühekülgsus (20-30-aastaste meessoost inimeste ülekaal ja naiste häälega materjali vähesus). , lapsed ja vanurid), sõnaraamatu muutlikkuse puudumine (samade fraaside kordamine) ja salvestiste levitamine moonutavas MP3-vormingus.

Allikas: opennet.ru

Lisa kommentaar