Mozilla Common Voice 12.0 Update

Mozilla huet seng Common Voice Datesätz aktualiséiert fir Aussprooch Echantillon vun iwwer 200 Leit ze enthalen. D'Donnéeën ginn als Public Domain (CC0) publizéiert. Déi proposéiert Sets kënnen a Maschinnléieresystemer benotzt ginn fir Riederkennungs- a Synthesemodeller ze bauen.

Am Verglach zum viregten Update ass de Volume vu Riedmaterial an der Sammlung vun 23.8 op 25.8 Tausend Stonne Ried eropgaang. Méi wéi 88 dausend Leit hunn un der Virbereedung vu Materialien op Englesch deelgeholl, diktéiert 3161 Stonnen Ried (et waren 84 dausend Participanten an 3098 Stonnen). De Set fir d'Belarussesch Sprooch deckt 7903 Participanten an 1419 Stonnen Riedmaterial (et waren 6965 Participanten an 1217 Stonnen), Russesch - 2815 Participanten an 229 Stonnen (et waren 2731 Participanten an 215 Stonnen), Usbekesch - 2092 Participanten an 262 Stonnen ( et waren 2025 Participanten an 258 Stonnen), Ukrainesch Sprooch - 780 Participanten an 87 Stonnen (et waren 759 Participanten an 87 Stonnen).

De Common Voice-Projet zielt fir gemeinsam Aarbecht ze organiséieren fir eng Datebank vu Stëmmmuster ze sammelen déi d'Diversitéit vu Stëmmen a Riedstiler berücksichtegt. D'Benotzer ginn invitéiert op Stëmm Sätze déi um Bildschierm ugewise ginn oder d'Qualitéit vun den Donnéeën vun anere Benotzer evaluéieren. Déi akkumuléiert Datebank mat Opzeechnunge vu verschiddene Aussoe vun typesche Sätze vu mënschlecher Ried kann ouni Restriktiounen a Maschinnléieresystemer an a Fuerschungsprojeten benotzt ginn.

Source: opennet.ru

Setzt e Commentaire