Mozilla Common Voice 8.0 Update

Mozilla renovationem dimisit ad datasetes vocis Communis, quae includunt exempla pronuntiationis ab hominibus fere 200 hominibus. Data est divulgatio publici iuris (CC0). Proposita proposita adhiberi possunt in apparatus studiorum systemata ad recognitionem et synthesim exempla orationis aedificandae. Praecedente renovatione comparata, volumen materiae orationis in collectione augetur 30% - ab 13.9 ad 18.2 mille horarum orationis. Numerus linguae sustentandae auctus est ab 67 ad 87.

Ordo linguae Russiae comprehendit 2452 participes et 193 horae materiales locutionis (erant 2136 participes et 173 horae), pro lingua Belarusica - 6160 participes et 987 horae (erant 3831 participes et 356 horae), pro lingua Ucraina. 684 participes et 76 horae (erant 615 participes et 66 horae). Plus quam 79 milia hominum in praeparatione materiae Anglice interfuerunt, dictantes 2886 horas loquelae confirmatae (erant 75 milia participantium et 2637 horae).

Commonefaciamus vos consilium vocis Communis intentum esse ad opus iuncturam ordinandi, ut exemplaribus datorum vocum cumulet quae diversitas vocum et locutionis stylorum rationem consideret. Usores invitantur ad locutiones vocis in velo ostendendas vel aestimandas qualitatem notitiae ab aliis usoribus additae. Cumulata database cum monumentis variarum vocum typicarum locutionum humanarum, adhiberi potest sine restrictionibus in systematis discendi et in investigationibus inceptis. Secundum continuam sermonis recognitionem bibliothecam Vosk auctor, incommoda vocis Communis posita sunt unum latus materiae vocis (praedominantia hominum 20-30 annorum, et defectus materiae cum vocibus mulierum. pueri et senes), defectus variabilitatis in dictionario (repetitio ejusdem phrasis) et tabulas distribuens in depravando MP3 forma.

Accedit, notare possumus emissionem NVIDIA NeMo 1.6 toolkit, quod apparatus discendi methodos praebet ad systemata cognoscendi loquelam, synthesim sermonis et linguae naturalis processus. NeMo exempla praeparata ad usum instructa includit ad machinas systemata discendi in structura PyTorch innixa, parata ab NVIDIA, data loquelae Communis usu et varietate linguarum, accentuum et locutionum formas obtegens. Exempla utiles esse possunt inquisitoribus explicandi systemata dialogi voce fundati, suggesta transcriptionis et vocationum centra automated. Exempli gratia, NVIDIA NeMo in servitiis vocis MTS et Sberbank adhibetur. In NeMo codice scriptum est in Pythone PyTorch utens et sub Apache 2.0 licentia distributum.

Source: opennet.ru