Els dies 17 i 19 de juny es van publicar les versions 1.9.0 i 1.9.1 del sistema de reconeixement automàtic de veu d'alt rendiment. xiuxiuejar.cpp, implementant el model Xiuxiueig d'OpenAI i una biblioteca d'aprenentatge automàtic basada en tensors GGML i format binari GGUF.
Es proporcionen la biblioteca libwhisper, les demostracions i les utilitats de consola: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli i parakeet-quantize.
Els projectes estan escrits en C i C++ i es distribueixen sota la llicència MIT.
Canvis:
- S'ha afegit la utilitat de consola parakeet-cli, que dóna suport al model NVIDIA Parakeet;
- També s'ha afegit la compatibilitat amb NVIDIA Parakeet al wrapper Ruby.
Alguns canvis importants fets en versions intermèdies des de les notícies whisper.cpp 1.8.0:
- Gestió d'excepcions de C++ a la funció whisper_init_with_params_no_state;
- El suport per a ffmpeg s'ha reescrit completament (sense utilitzar codi GPL extret d'exemples de ffmpeg) i s'ha aclarit l'ús de ffmpeg a whisper.cpp;
- La utilitat whisper-cli ara té una nova opció —version— per mostrar la versió.
Font: linux.org.ru




