Mozilla Common Voice 8.0 Update

Mozilla huet en Update fir seng Common Voice Datesätz verëffentlecht, déi Aussprooch Echantillon vu bal 200 Leit enthalen. D'Donnéeën ginn als Public Domain (CC0) publizéiert. Déi proposéiert Sets kënnen a Maschinnléieresystemer benotzt ginn fir Riederkennungs- a Synthesemodeller ze bauen. Am Verglach mat der viregter Aktualiséierung ass de Volume vu Riedmaterial an der Sammlung ëm 30% eropgaang - vun 13.9 op 18.2 Tausend Stonne Ried. D'Zuel vun de ënnerstëtzte Sproochen ass vu 67 op 87 eropgaang.

De Set fir déi russesch Sprooch deckt 2452 Participanten an 193 Stonnen Riedmaterial (et waren 2136 Participanten an 173 Stonnen), fir d'Belarussesch Sprooch - 6160 Participanten an 987 Stonnen (et waren 3831 Participanten an 356 Stonnen), fir d'Ukrainesch Sprooch - 684 Participanten a 76 Stonnen (et waren 615 Participanten a 66 Stonnen). Méi wéi 79 Tausend Leit hunn un der Virbereedung vun Material op Englesch deelgeholl, diktéiert 2886 Stonnen bestätegt Ried (et waren 75 Tausend Participanten an 2637 Stonnen).

Loosst eis Iech drun erënneren datt de Common Voice Projet zielt fir gemeinsam Aarbecht ze organiséieren fir eng Datebank vu Stëmmmuster ze sammelen déi d'Diversitéit vu Stëmmen a Riedstiler berücksichtegt. D'Benotzer ginn invitéiert fir Sätze déi um Bildschierm ugewise ginn ze stëmmen oder d'Qualitéit vun den Donnéeën vun anere Benotzer ze evaluéieren. Déi akkumuléiert Datebank mat Opzeechnunge vu verschiddene Aussoe vun typesche Sätze vu mënschlecher Ried kann ouni Restriktiounen a Maschinnléieresystemer an a Fuerschungsprojeten benotzt ginn. Laut dem Autor vun der Vosk kontinuéierlecher Riederkennungsbibliothéik sinn d'Nodeeler vum Common Voice Set d'Eensäitegkeet vum Stëmmmaterial (d'Prédominatioun vu männleche Leit 20-30 Joer al, an de Mangel u Material mat de Stëmme vu Fraen , Kanner an eeler Leit), de Mangel u Verännerlechkeet am Wierderbuch (Wiederholung vun deene selwechte Sätze) an d'Verdeelung vun Opzeechnungen am verzerrend MP3-Format.

Zousätzlech kënne mir d'Verëffentlechung vum NVIDIA NeMo 1.6 Toolkit notéieren, deen Maschinnléieremethoden ubitt fir Sproocherkennungssystemer, Riedsynthese an natierlech Sproochveraarbechtung ze kreéieren. NeMo enthält prett-ze-benotzen trainéiert Modeller fir Maschinn Léiersystemer baséiert op dem PyTorch Kader, virbereet vun NVIDIA mat Common Voice Rieddaten an iwwerdeckt eng Vielfalt vu Sproochen, Akzenter a Forme vu Ried. D'Modeller kënnen nëtzlech sinn fir Fuerscher, déi Stëmmbaséiert Dialogsystemer, Transkriptiounsplattformen an automatiséiert Call Centers entwéckelen. Zum Beispill gëtt NVIDIA NeMo an automatiséierte Stëmmservicer vu MTS a Sberbank benotzt. Den NeMo Code gëtt am Python mat PyTorch geschriwwen an ënner der Apache 2.0 Lizenz verdeelt.

Source: opennet.ru

Setzt e Commentaire