El 6 de gener va tenir lloc el llançament de la versió 1.7.4 del sistema de reconeixement automàtic de veu d'alt rendiment xiuxiuejar.cpp, implementant el model Xiuxiueig per OpenAI, escrit en C i C++ i distribuït sota la llicència MIT.
El projecte utilitza la biblioteca d'aprenentatge automàtic tensor de l'autor GGML, escrit en C i optimitzat per utilitzar diversos backends (CUDA, Vulkan, BLAS, SYCL, OpenCL, etc.).
Llista de canvis:
- Canviar el nom dels fitxers executables:
main -> whisper-cli bench -> whisper-bench stream -> whisper-stream command -> whisper-command server -> whisper-server talk-llama -> whisper-talk-llama
- S'han eliminat els exemples talk i talk.wasm.
- S'ha afegit una opció per suprimir els testimonis que no són de parla al servidor de xiuxiueig.
- S'ha canviat el nom del paràmetre suppress_non_speech_tokens a suppress_nst.
- S'ha afegit l'opció no_speech_thold a l'API i a les utilitats per establir la probabilitat d'absència de veu al nivell del segment durant la transcripció.
- S'ha afegit l'opció --suppress_nst a whisper-cli.
- Altres millores i correccions d'errors.
Font: linux.org.ru
