Mozilla Common Voice 12.0 Voice Update

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи.

По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 23.8 до 25.8 тысяч часов речи. В подготовке материалов на английском языке приняли участие более 88 тысяч человек, надиктовавших 3161 час речи (было 84 тысячи участников и 3098 часов). Набор для белорусского языка охватывает 7903 участников и 1419 часов речевого материала (было — 6965 участников и 1217 часов), русского языка — 2815 участников и 229 часов (было 2731 участник и 215 часов), узбекского — 2092 участника и 262 часа (было 2025 участников и 258 часов), украинского языка — 780 участников и 87 часов (было 759 участников и 87 часов).

די Common Voice פּרויעקט יימז צו אָרגאַניזירן שלאָס אַרבעט צו אָנקלייַבן אַ דאַטאַבייס פון קול פּאַטערנז וואָס נעמט אין חשבון די דייווערסיטי פון קולות און רעדע סטיילז. יוזערז זענען פארבעטן צו קול פראַסעס געוויזן אויף דעם עקראַן אָדער אָפּשאַצן די קוואַליטעט פון דאַטן צוגעגעבן דורך אנדערע יוזערז. די אַקיומיאַלייטיד דאַטאַבייס מיט רעקאָרדס פון פאַרשידן פּראָונאַנסייישאַנז פון טיפּיש פראַסעס פון מענטש רעדע קענען זיין געוויינט אָן ריסטריקשאַנז אין מאַשין לערנען סיסטעמען און אין פאָרשונג פּראַדזשעקס.

מקור: opennet.ru

לייגן אַ באַמערקונג