6. januára sa uskutočnilo vydanie 1.7.4 vysokovýkonného systému automatického rozpoznávania reči šepkať.cppimplementáciu modelu šepot od OpenAI, napísaný v C a C++ a distribuovaný pod licenciou MIT.
Projekt využíva autorovu knižnicu strojového učenia tenzorov GGML, napísaný v C a optimalizovaný pre použitie rôznych backendov (CUDA, Vulkan, BLAS, SYCL, OpenCL atď.).
Zoznam zmien:
- Premenovanie spustiteľných súborov:
main -> whisper-cli bench -> whisper-bench stream -> whisper-stream command -> whisper-command server -> whisper-server talk-lama -> whisper-talk-lama
- Odstránené príklady talk and talk.wasm.
- Na whisper-server bola pridaná možnosť potlačiť nerečové tokeny.
- Parameter potlačenia_non_speech_tokens bol premenovaný na supresiu_nst.
- Do API a utilít bola pridaná možnosť no_speech_thold na nastavenie pravdepodobnosti absencie reči na úrovni segmentu počas prepisu.
- Do whisper-cli bola pridaná možnosť -suppress_nst.
- Ďalšie vylepšenia a opravy chýb.
Zdroj: linux.org.ru
