NVIDIA investéiert $ 1.5 Milliounen am Mozilla Common Voice Projet. Interessi u Riederkennungssystemer staamt aus der Prognose datt iwwer déi nächst zéng Joer Stëmmtechnologie eng vun den Haapt Weeër gëtt fir d'Leit mat Apparater ze interagéieren, rangéiert vu Computeren an Telefonen bis digital Assistenten a Kiosken.
D'Performance vu Stëmmsystemer ass héich ofhängeg vum Volumen an der Varietéit vun de Stëmmdaten, déi verfügbar sinn fir Maschinnléiermodeller ze trainéieren. D'Stëmmtechnologie vun haut konzentréiert sech haaptsächlech op Englesch Sproocherkennung an deckt net déi grouss Gamme vu Sproochen, Akzenter a Riedmuster of. D'Investitioun hëlleft de Wuesstum vun ëffentleche Stëmmdaten ze beschleunegen, méi Gemeinschaften a Fräiwëlleger engagéieren an d'Zuel vu Vollzäitprojetpersonal ausbauen.
Loosst eis Iech drun erënneren datt de Common Voice Projet zielt fir gemeinsam Aarbecht ze organiséieren fir eng Datebank vu Stëmmmuster ze sammelen déi d'Diversitéit vu Stëmmen a Riedstiler berücksichtegt. D'Benotzer ginn invitéiert op Stëmm Sätze déi um Bildschierm ugewise ginn oder d'Qualitéit vun den Donnéeën vun anere Benotzer evaluéieren. Déi akkumuléiert Datebank mat Opzeechnunge vu verschiddene Aussoe vun typesche Sätze vu mënschlecher Ried kann ouni Restriktiounen a Maschinnléieresystemer an a Fuerschungsprojeten benotzt ginn.
De Common Voice Set enthält de Moment Aussproochbeispiller vun iwwer 164 Leit. Ongeféier 9 dausend Stonne Stëmmdaten goufen a 60 verschiddene Sprooche gesammelt. De Set fir déi russesch Sprooch deckt 1412 Participanten an 111 Stonnen Riedmaterial, a fir d'Ukrainesch Sprooch - 459 Participanten an 30 Stonnen. Zum Verglach, hu méi wéi 66 dausend Leit un der Virbereedung vu Materialien op Englesch deelgeholl, 1686 Stonnen verifizéiert Ried diktéiert. Déi proposéiert Sets kënnen a Maschinnléieresystemer benotzt ginn fir Riederkennungs- a Synthesemodeller ze bauen. D'Donnéeën ginn als Public Domain (CC0) publizéiert.
Laut dem Auteur vun der Vosk kontinuéierlecher Riederkennungsbibliothéik sinn d'Nodeeler vum Common Voice Set d'Eenseitegkeet vum Stëmmmaterial (d'Prédominatioun vu männleche Leit 20-30 Joer al, an de Mangel u Material mat de Stëmme vu Fraen , Kanner an eeler Leit), de Mangel u Verännerlechkeet am Wierderbuch (Wiederholung vun de selwechte Sätze) an d'Verdeelung vun Opzeechnungen am verzerrten MP3-Format.
Source: opennet.ru
