Mozilla Common Voice 9.0-oppdatering

Mozilla har gitt ut en oppdatering til sine Common Voice-datasett, som inkluderer uttaleprøver fra nesten 200 0 personer. Dataene er publisert som offentlig eiendom (CCXNUMX). De foreslåtte settene kan brukes i maskinlæringssystemer for å bygge talegjenkjennings- og syntesemodeller.

Sammenlignet med forrige oppdatering økte volumet av talemateriale i samlingen med 10% - fra 18.2 til 20.2 tusen timer med tale. Antall støttede språk har økt fra 87 til 93. For 27 språk er det akkumulert mer enn 100 timer med taledata, og for 9 - mer enn 500 timer med taledata. For 9 språk var det også mulig å oppnå en andel kvinnelig tale på minst 45 %.

Mer enn 81 tusen mennesker deltok i utarbeidelsen av materiell på engelsk, og dikterte 2953 timer med tale (det var 79 tusen deltakere og 2886 timer). Settet for det hviterussiske språket dekker 6326 deltakere og 1054 timer med talemateriale (det var 6160 deltakere og 987 timer), russisk - 2585 deltakere og 201 timer (det var 2452 deltakere og 193 timer), usbekisk - 1503 deltakere og 231 timer ( det var 1355 deltakere og 227 timer), ukrainsk språk - 696 deltakere og 79 timer (det var 684 deltakere og 76 timer).

Common Voice-prosjektet har som mål å organisere felles arbeid for å akkumulere en database med stemmemønstre som tar hensyn til mangfoldet av stemmer og talestiler. Brukere inviteres til å stemme fraser som vises på skjermen eller evaluere kvaliteten på data som er lagt til av andre brukere. Den akkumulerte databasen med registreringer av ulike uttaler av typiske uttrykk for menneskelig tale kan brukes uten begrensninger i maskinlæringssystemer og i forskningsprosjekter.

Kilde: opennet.ru

Legg til en kommentar