Január 6-án megjelent a nagy teljesítményű automatikus beszédfelismerő rendszer 1.7.4-es verziója suttogás.cpp, a modell megvalósítása Suttogás az OpenAI, C és C++ nyelven íródott, és MIT licenc alatt terjeszthető.
A projekt a szerző tenzoros gépi tanulási könyvtárát használja GGML, C nyelven írva és különféle háttérprogramok (CUDA, Vulkan, BLAS, SYCL, OpenCL stb.) használatára optimalizálva.
Változások listája:
- Futtatható fájlok átnevezése:
fő -> whisper-cli bench -> whisper-bench stream -> whisper-stream parancs -> whisper-command szerver -> whisper-server talk-llama -> whisper-talk-llama
- Eltávolított példák beszélni és beszélni.wasm.
- A beszéd nélküli tokenek letiltásának lehetőségét hozzáadtuk a whisper-serverhez.
- A suppress_non_speech_tokens paramétert átnevezték a suppress_nst névre.
- A no_speech_thold beállítás hozzáadásra került az API-hoz és a segédprogramokhoz, hogy beállítsa a beszéd hiányának valószínűségét szegmens szinten az átírás során.
- A -suppress_nst opció hozzáadva a whisper-cli-hez.
- Egyéb fejlesztések és hibajavítások.
Forrás: linux.org.ru
