Нові моделі для розпізнавання російської мови у бібліотеці Vosk

Розробники бібліотеки Vosk опублікували нові моделі для розпізнавання російської мови: серверна vosk-model-ru-0.22 та мобільна Vosk-model-small-ru-0.22. У моделях використовуються нові мовні дані, а також нова нейромережева архітектура, що дозволило підвищити точність розпізнавання на 10-20%. Код та дані розповсюджуються під ліцензією Apache 2.0.

Важливі зміни:

  • Нові дані, зібрані в голосових колонках, значно покращують розпізнавання мовних команд, сказаних з відстані.
  • Нова схема отримання звуку дозволила значно покращити точність розпізнавання для широкосмугових записів. У той же час, точність розпізнавання телефонії також покращала.
  • Пакет для доповнення словника дозволяє настроїти розпізнавання складних технічних записів.

Для найкращої точності рекомендується оновити версію Воска до 0.3.32. Також можуть бути цікаві нові можливості Воска – інтеграції з Unity, Nativescript, Jigasi. Моделі для розпізнавання казахської та української мов. Серверної моделі для роботи потрібен сучасний процесор та 8Гб пам'яті. Мобільна модель може використовуватись у телефонах та RaspberryPi 3+.

Джерело: opennet.ru

Додати коментар або відгук