Новыя мадэлі для распазнання рускай гаворкі ў бібліятэцы Vosk

Распрацоўнікі бібліятэкі Vosk апублікавалі новыя мадэлі для распазнання рускай гаворкі: серверная vosk-model-ru-0.22 і мабільная Vosk-model-small-ru-0.22. У мадэлях выкарыстоўваюцца новыя маўленчыя дадзеныя, а таксама новая нейра-сеткавая архітэктура, што дазволіла павысіць дакладнасць распазнання на 10-20%. Код і дадзеныя распаўсюджваюцца пад ліцэнзіяй Apache 2.0.

Важныя змены:

  • Новыя дадзеныя, сабраныя ў галасавых калонках, значна паляпшаюць распазнанне маўленчых каманд, вымаўленых з адлегласці.
  • Новая схема вымання гуку дазволіла значна палепшыць дакладнасць распазнання для шырокапалосных запісаў. У той жа час, дакладнасць распазнання тэлефаніі таксама палепшылася.
  • Пакет для дадатку слоўніка дазваляе наладзіць распазнанне складаных тэхнічных запісаў.

Для найлепшай дакладнасці рэкамендуецца абнавіць і версію воску да 0.3.32. Таксама могуць быць цікавыя новыя магчымасці Воска – інтэграцыі з Unity, Nativescript, Jigasi. Мадэлі для распазнання казахскай і ўкраінскай моў. Сервернай мадэлі для працы патрэбен сучасны працэсар і 8Гб памяці. Мабільная мадэль можа выкарыстоўвацца ў тэлефонах і RaspberryPi 3+.

Крыніца: opennet.ru

Дадаць каментар