Vosk 库中的俄语语音识别新模型

Vosk 库的开发人员发布了俄语语音识别的新模型:服务器 vosk-model-ru-0.22 和移动 Vosk-model-small-ru-0.22。 该模型使用新的语音数据以及新的神经网络架构,将识别准确率提高了 10-20%。 代码和数据根据 Apache 2.0 许可证分发。

重要变化:

  • 语音扬声器中收集的新数据显着提高了对远距离语音命令的识别。
  • 新的音频提取方案显着提高了宽带录音的识别准确性。 同时,电话识别的准确率也有所提高。
  • 词典扩展包允许您自定义复杂技术记录的识别。

为了获得最佳准确性,建议将 Wax 版本更新至 0.3.32。 您可能还对 Vosk 的新功能感兴趣 - 与 Unity、Nativescript、Jigasi 集成。 用于识别哈萨克语和乌克兰语的模型。 服务器型号需要现代处理器和 8GB 内存才能运行。 移动型号可用于手机和RaspberryPi 3+。

来源: opennet.ru

添加评论