Den 6 januari släpptes 1.7.4 av det högpresterande automatiska taligenkänningssystemet whisper.cpp, implementera modellen Viska av OpenAI, skriven i C och C++ och distribuerad under MIT-licensen.
Projektet använder författarens tensor maskininlärningsbibliotek GGML, skriven i C och optimerad för att använda olika backends (CUDA, Vulkan, BLAS, SYCL, OpenCL, etc.).
Lista över ändringar:
- Byta namn på körbara filer:
main -> whisper-cli bänk -> whisper-bench stream -> whisper-stream kommando -> whisper-command server -> whisper-server talk-llama -> whisper-talk-llama
- Borttagna exempel talk and talk.wasm.
- Ett alternativ för att undertrycka icke-tal-tokens har lagts till i whisper-server.
- Parametern suppress_non_speech_tokens har bytt namn till suppress_nst.
- Alternativet no_speech_thold har lagts till API och verktyg för att ställa in sannolikheten för talfrånvaro på segmentnivå under transkription.
- Lade till alternativet -suppress_nst för att whisper-cli.
- Andra förbättringar och buggfixar.
Källa: linux.org.ru
