NVIDIA 1.5 mîlyon dolar di projeya Mozilla Common Voice de veberhênan dike

Компания NVIDIA инвестирует 1.5 млн долларов в проект Mozilla Common Voice. Интерес к системам распознавания речи связан с прогнозом, что в следующие десять лет голосовые технологии станут одним из основных способов взаимодействия людей с различными устройствами, от компьютеров и телефонов, до цифровых ассистентов и киосков для продажи товаров.

Качество работы голосовых систем сильно зависит от объёма и разнообразия голосовых данных, доступных для тренировки моделей машинного обучения. Сегодняшние голосовые технологии в основном сосредоточены на распознании английского языка и не охватывают огромное количество языков, акцентов и моделей речи. Инвестиции помогут ускорить наращивание объёма общедоступных голосовых данных, привлечь к работе больше сообществ и волонтёров, а также расширить число сотрудников, занимающихся проектом в основное рабочее время.

Werin em bînin bîra we ku projeya Dengê Hevbeş organîzekirina xebata hevbeş e ji bo berhevkirina databasek ji qalibên dengan ku cihêrengiya dengan û şêwazên axaftinê li ber çavan digire. Bikarhêner têne vexwendin ku bêjeyên dengî yên ku li ser ekranê têne xuyang kirin an jî kalîteya daneya ku ji hêla bikarhênerên din ve hatî zêdekirin dinirxînin. Databasa berhevkirî ya bi tomarên bilêvkirinên cihêreng ên biwêjên tîpîk ên axaftina mirovî dikare di pergalên fêrbûna makîneyê û di projeyên lêkolînê de bê sînor were bikar anîn.

В настоящее время набор Common Voice включает примеры произношения более 164 тысяч людей. Накоплено около 9 тысяч часов голосовых данных на 60 различных языках. Набор для русского языка охватывает 1412 участников и 111 часов речевого материала, а для украинского языка — 459 участников и 30 часов. Для сравнения в подготовке материалов на английском языке приняли участие более 66 тысяч человек, надиктовавших 1686 часов подтверждённой речи. Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. Данные опубликованы как общественное достояние (CC0).

Li gorî nivîskarê pirtûkxaneya naskirina axaftina berdewam a Vosk, kêmasiyên koma Dengê Hevbeş yekalîbûna materyalê deng e (serdestiya mêrên 20-30 salî, û kêmbûna materyalên bi dengê jinan. , zarok û extiyar), nebûna guhêrbariya ferhengê (dubarekirina heman hevokan) û belavkirina tomarên bi formata MP3 ya berovajîkirî.

Source: opennet.ru

Add a comment