6月1.7.4日,高效能自動語音辨識系統XNUMX版本發布 耳語.cpp,實施模型 耳語 由 OpenAI 開發,以 C 和 C++ 編寫,並根據 MIT 許可證分發。
專案使用了作者的張量機器學習庫 GGML,以 C 編寫,並針對使用各種後端(CUDA、Vulkan、BLAS、SYCL、OpenCL 等)進行了最佳化。
變更清單:
- 重新命名可執行檔:
主 -> 耳語-cli 工作台 -> 耳語-工作台流 -> 耳語流命令 -> 耳語命令伺服器 -> 耳語伺服器 talk-llama -> 耳語-talk-llama
- 刪除了 talk 和 talk.wasm 範例。
- 耳語伺服器中新增了抑制非語音標記的選項。
- suppress_non_speech_tokens 參數已重新命名為suppress_nst。
- no_speech_thold 選項已新增至 API 和實用程式中,用於設定轉錄期間片段層級的語音缺失機率。
- 新增選項 -suppress_nst 到 Whisper-cli。
- 其他改進和錯誤修復。
來源: linux.org.ru
