Suorituskykyisen automaattisen puheentunnistusjärjestelmän versiot 1.9.0 ja 1.9.1 julkaistiin 17. ja 19. kesäkuuta. whisper.cpp, toteuttaa mallia Kuiskaus OpenAI:lta ja tensoripohjainen koneoppimiskirjasto GGML ja binäärimuodossa GGUF.
Tarjolla ovat libwhisper-kirjasto, demot ja konsoliapuohjelmat: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli ja parakeet-quantize.
Projektit on kirjoitettu C- ja C++-kielillä ja ne jaetaan MIT-lisenssin alaisuudessa.
Muutokset:
- Parakeet-cli-konsolityökalu on lisätty tukemaan mallia NVIDIA Parakeet;
- NVIDIA Parakeet -tuki on lisätty myös Ruby-kääreeseen.
Joitakin tärkeitä muutoksia tehtiin väliversiot uutisista lähtien whisper.cpp 1.8.0:
- C++-poikkeusten käsittely whisper_init_with_params_no_state-funktiossa;
- ffmpeg-tuki on kirjoitettu kokonaan uudelleen (ilman ffmpeg-esimerkeistä lainattua GPL-koodia), ja ffmpeg:n käyttöä whisper.cpp-tiedostossa on selvennetty;
- Whisper-cli-apuohjelmassa on nyt uusi vaihtoehto —version, jolla voit näyttää version.
Lähde: linux.org.ru




