Нови модели за руски препознавање говор во библиотеката Воск

Програмерите на библиотеката Воск објавија нови модели за препознавање на руски говор: сервер vosk-model-ru-0.22 и мобилен Vosk-model-small-ru-0.22. Моделите користат нови говорни податоци, како и нова архитектура на невронска мрежа, која ја зголеми точноста на препознавање за 10-20%. Кодот и податоците се дистрибуираат под лиценцата Apache 2.0.

Важни промени:

  • Новите податоци собрани во гласовните звучници значително го подобруваат препознавањето на говорните команди изговорени од далечина.
  • Новата шема за извлекување аудио значително ја подобри прецизноста на препознавањето за снимките со широк опсег. Во исто време, се подобри и точноста на препознавањето на телефонијата.
  • Пакетот за проширување на речникот ви овозможува да го приспособите препознавањето на сложени технички записи.

За најдобра точност, се препорачува да се ажурира верзијата Wax на 0.3.32. Можеби ќе ве интересираат и новите функции на Vosk - интеграција со Unity, Nativescript, Jigasi. Модели за препознавање казахстански и украински јазици. Моделот на серверот бара модерен процесор и 8 GB меморија за да работи. Мобилниот модел може да се користи во телефони и RaspberryPi 3+.

Извор: opennet.ru

Додадете коментар