Mozilla Common Voice 12.0-oppdatering

Mozilla har oppdatert sine Common Voice-datasett for å inkludere uttaleprøver fra over 200 0 personer. Dataene er publisert som offentlig eiendom (CCXNUMX). De foreslåtte settene kan brukes i maskinlæringssystemer for å bygge talegjenkjennings- og syntesemodeller.

Sammenlignet med forrige oppdatering økte volumet av talemateriale i samlingen fra 23.8 til 25.8 tusen timer med tale. Mer enn 88 tusen mennesker deltok i utarbeidelsen av materiell på engelsk, og dikterte 3161 timer med tale (det var 84 tusen deltakere og 3098 timer). Settet for det hviterussiske språket dekker 7903 deltakere og 1419 timer med talemateriale (det var 6965 deltakere og 1217 timer), russisk - 2815 deltakere og 229 timer (det var 2731 deltakere og 215 timer), usbekisk - 2092 deltakere og 262 timer ( det var 2025 deltakere og 258 timer), ukrainsk språk - 780 deltakere og 87 timer (det var 759 deltakere og 87 timer).

Common Voice-prosjektet har som mål å organisere felles arbeid for å akkumulere en database med stemmemønstre som tar hensyn til mangfoldet av stemmer og talestiler. Brukere inviteres til å stemme fraser som vises på skjermen eller evaluere kvaliteten på data som er lagt til av andre brukere. Den akkumulerte databasen med registreringer av ulike uttaler av typiske uttrykk for menneskelig tale kan brukes uten begrensninger i maskinlæringssystemer og i forskningsprosjekter.

Kilde: opennet.ru

Legg til en kommentar