Vosk 庫中的俄語語音辨識新模型

Vosk 函式庫的開發人員發布了俄語語音辨識的新模型:伺服器 vosk-model-ru-0.22 和行動 Vosk-model-small-ru-0.22。 該模型使用新的語音數據以及新的神經網路架構,將識別準確率提高了 10-20%。 程式碼和資料根據 Apache 2.0 許可證分發。

重要變化:

  • 語音揚聲器中收集的新數據顯著提高了遠距離語音命令的辨識。
  • 新的音訊擷取方案顯著提高了寬頻錄音的辨識準確性。 同時,電話辨識的準確率也有所提升。
  • 字典擴充包可讓您自訂複雜技術記錄的識別。

為了獲得最佳準確性,建議將 Wax 版本更新至 0.3.32。 您可能也對 Vosk 的新功能感興趣 - 與 Unity、Nativescript、Jigasi 整合。 用於識別哈薩克語和烏克蘭語的模型。 伺服器型號需要現代處理器和 8GB 記憶體才能運作。 行動型號可用於手機和RaspberryPi 3+。

來源: opennet.ru

添加評論