Нови модели за руски препознавање говор во библиотеката Воск

Програмерите на библиотеката Воск објавија нови модели за препознавање на руски говор: сервер vosk-model-ru-0.22 и мобилен Vosk-model-small-ru-0.22. Моделите користат нови говорни податоци, како и нова архитектура на невронска мрежа, која ја зголеми точноста на препознавање за 10-20%. Кодот и податоците се дистрибуираат под лиценцата Apache 2.0.

Важни промени:

  • Новите податоци собрани во гласовните звучници значително го подобруваат препознавањето на говорните команди изговорени од далечина.
  • Новата шема за извлекување аудио значително ја подобри прецизноста на препознавањето за снимките со широк опсег. Во исто време, се подобри и точноста на препознавањето на телефонијата.
  • Пакетот за проширување на речникот ви овозможува да го приспособите препознавањето на сложени технички записи.

За најдобра точност, се препорачува да го ажурирате Vosk на верзија 0.3.32. Можеби ќе ве интересираат и новите функции на Vosk, како што се интеграциите со Unity, NativeScript и Jigasi. Модели за препознавање на казахстанскиот и украинскиот јазик. Моделот на серверот бара модерен процесор и 8GB меморија. Мобилниот модел може да се користи во телефони и Raspberry Pi 3+.

Извор: opennet.ru

Купете доверлив хостинг за сајтови со DDoS заштита, VPS VDS сервери 🔥 Купете сигурен веб-хостинг со DDoS заштита, VPS VDS сервери | ProHoster