Mozilla Common Voice 7.0 Update

NVIDIA et Mozilla renovationem emiserunt ad datastas suas Communis Vocis, quae includunt 182 exempla sermonis hominum, usque 25% ab ante mensibus VI. Data est divulgatio publici iuris (CC6). Proposita proposita adhiberi possunt in apparatus studiorum systemata ad recognitionem et synthesim exempla orationis aedificandae.

Praecedente renovatione comparata, magnitudo materiae sermonis in collectione ab 9 ad 13.9 mille horarum orationis crevit. Numerus linguarum sustentatorum ab 60 ad 76 crevit, inter primum subsidium linguae Belarusianae, Kazakh, Uzbek, Bulgarica, Armena, Azerbaijani et Bashkir. Copia linguae Russicae 2136 participantes et 173 horae materiae locutionis (erant 1412 participes et 111 horae), et pro lingua Ucraina 615 participes et 66 horae (erant 459 participes et 30 horae).

Plus quam 75 milia hominum in praeparatione materiae Anglice interfuerunt, dictantes 2637 horas orationis confirmatae (erant 66 milia participantium et 1686 horae). Interestingly, lingua secundo loco secundum quantitatem notitiarum coacervatarum Ruanda est, pro qua 2260 horae collectae sunt. Hanc sequuntur Germani (1040), Catalan (920) et Esperanto (840). Inter amplitudinem vocis notitiae dynamice augendae sunt linguae Thai (20-triplex in basi auctum, ab 12 ad 250 horis), Luganda (ab 8 ad 80 horas), Esperanto (ab 100 ad 840 horis) et Tamil ( a 24 ad 220 horas).

Pro parte participationis in project Vocis Communis, NVIDIA exemplaria praeparata instructa ad machinas systemata discendi ex data collecta (sustentata PyTorch). Exempla distributa sunt pro parte gratuiti et aperti NVIDIA NeMo toolkit, quae, exempli gratia, iam in servitiis vocis MTS et Sberbank automated adhibetur. Exempla quae in usu sunt agnitio sermonis, synthesis sermonis, et rationum naturalium linguae processus, et utilia sunt investigatoribus fabricandi systemata dialogi vocis actuati, suggesta transcriptionis, et centra vocationis automated. Dissimiles antea inceptis in promptu sunt, exempla editorum non limitantur ad agnitionem linguae Latinae et varias linguas, accentuum ac loquendi formas contegunt.

Commonefaciamus vos consilium vocis Communis intentum esse ad opus iuncturam ordinandi, ut exemplaribus datorum vocum cumulet, quae diversitas vocum et locutionis stylorum rationem consideret. Usores invitantur ad locutiones vocis in velo ostendendas vel aestimandas qualitatem notitiae ab aliis usoribus additae. Cumulata database cum monumentis variarum locutionum typicarum locutionum humanarum locutionum, adhiberi potest sine restrictionibus in systematis discendi et in investigationibus inceptis.

Secundum auctoris Vosk continuam sermonis recognitionem bibliothecam, incommoda vocis Communis posita sunt unum latus materiae vocis (praedominantia hominum 20-30 annorum, et defectus materiae cum vocibus mulierum. pueri et senes), defectus variabilitatis in dictionario (repetitio ejusdem phrasis) et distributio tabularum in depravando MP3 forma.

Source: opennet.ru