6月17日と19日に、高性能自動音声認識システムのバージョン1.9.0と1.9.1がリリースされた。 ささやき.cpp、モデルを実装する ウィスパー OpenAI およびテンソルベースの機械学習ライブラリ GGML バイナリ形式 ググフ.
libwhisperライブラリ、デモ、およびコンソールユーティリティとして、whisper-bench、whisper-cli、whisper-command、whisper-lsp、whisper-quantize、whisper-server、whisper-stream、whisper-vad-speech-segments、parakeet-cli、およびparakeet-quantizeが提供されています。
これらのプロジェクトはC言語とC++で記述されており、MITライセンスの下で配布されています。
変更点
- parakeet-cli コンソールユーティリティが追加され、モデルがサポートされるようになりました。 NVIDIA Parakeet;
- RubyラッパーにNVIDIA Parakeetのサポートも追加されました。
重要な変更点として、 中間バージョン ニュース以来 ささやき.cpp 1.8.0:
- whisper_init_with_params_no_state 関数における C++ 例外処理;
- ffmpegのサポートが完全に書き直され(ffmpegのサンプルから取得したGPLコードは使用せず)、whisper.cppにおけるffmpegの使用方法が明確化されました。
- whisper-cliユーティリティに、バージョンを表示するための新しいオプション「--version」が追加されました。
出所: linux.org.ru




