17. ja 19. juunil avaldati kõrgjõudlusega automaatse kõnetuvastussüsteemi versioonid 1.9.0 ja 1.9.1. whisper.cpp, rakendades mudelit Sosin OpenAI-st ja tensoril põhinevast masinõppekogust GGML ja binaarvormingus GGUF.
Pakutakse libwhisperi teeki, demosid ja konsooli utiliite: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli ja parakeet-quantize.
Projektid on kirjutatud C ja C++ keeles ning levitatakse MIT litsentsi alusel.
Muudatused:
- Lisatud on konsooli utiliit parakeet-cli, mis toetab mudelit NVIDIA Parakeet;
- Ruby wrapperile on lisatud ka NVIDIA Parakeeti tugi.
Mõned olulised muudatused, mis tehti vahepealsed versioonid uudiste ilmumisest saati whisper.cpp 1.8.0:
- C++ erandite käsitlemine funktsioonis whisper_init_with_params_no_state;
- ffmpeg'i tugi on täielikult ümber kirjutatud (ilma ffmpeg'i näidetest võetud GPL-koodi kasutamata) ja ffmpeg'i kasutamist whisper.cpp-failis on selgitatud;
- Whisper-cli utiliidil on nüüd uus valik —version, mis kuvab versiooni.
Allikas: linux.org.ru




