NVIDIA investeerib Mozilla Common Voice'i projekti 1.5 miljonit dollarit. Huvi kõnetuvastussüsteemide vastu tuleneb ennustusest, et järgmise kümne aasta jooksul saab häältehnoloogiast üks peamisi viise, kuidas inimesed suhtlevad erinevate seadmetega, alates arvutitest ja telefonidest kuni digitaalsete assistentide ja müügiautomaatideni.
Häälsüsteemide jõudlus sõltub suuresti masinõppemudelite treenimiseks saadaolevate hääleandmete mahust ja mitmekesisusest. Praegused hääletehnoloogiad keskenduvad peamiselt inglise keele tuvastamisele ega kata laia valikut keeli, aktsente ja kõnemustreid. Investeeringud aitavad kiirendada avalikult kättesaadavate hääleandmete kasvu, kaasata rohkem kogukondi ja vabatahtlikke ning laiendada täiskohaga projektipersonali arvu.
Tuletame meelde, et ühishääle projekt on suunatud ühistöö korraldamisele häälte ja kõnestiilide mitmekesisust arvestava häälemustrite andmebaasi kogumiseks. Kasutajaid kutsutakse hääldama ekraanil kuvatavaid fraase või hindama teiste kasutajate lisatud andmete kvaliteeti. Kogutud andmebaasi inimkõne tüüpiliste fraaside erinevate häälduste kirjetega saab piiranguteta kasutada masinõppesüsteemides ja uurimisprojektides.
Common Voice'i andmestik sisaldab praegu hääldusnäidiseid enam kui 164 000 inimeselt, mis kokku moodustavad ligikaudu 9000 tundi häälandmeid 60 erinevas keeles. Venekeelne andmestik sisaldab 1412 osalejat ja 111 tundi kõnematerjali, Ukrainakeelne andmestik aga 459 osalejat ja 30 tundi. Võrdluseks, inglise keele andmestikku panustasid üle 66 000 inimese 1686 tundi kontrollitud kõnet. Neid andmestikke saab masinõppesüsteemides kasutada kõnetuvastuse ja -sünteesi mudelite loomiseks. Andmed on avaldatud avalikus omandis (CC0).
Pideva kõnetuvastuse raamatukogu Vosk autori sõnul on Common Voice komplekti miinusteks häälematerjali ühekülgsus (20-30-aastaste meessoost inimeste ülekaal ja naiste häälega materjali vähesus). , lapsed ja vanurid), sõnaraamatu muutlikkuse puudumine (samade fraaside kordamine) ja salvestiste levitamine moonutavas MP3-vormingus.
Allikas: opennet.ru
