Dana 6. siječnja objavljena je verzija 1.7.4 sustava za automatsko prepoznavanje govora visokih performansi. šaptati.cpp, implementirajući model Šapat od strane OpenAI-a, napisan u C i C++ i distribuiran pod licencom MIT-a.
Projekt koristi autorovu tensor machine learning biblioteku GGML, napisan u C-u i optimiziran za korištenje različitih pozadina (CUDA, Vulkan, BLAS, SYCL, OpenCL, itd.).
Popis promjena:
- Preimenovanje izvršnih datoteka:
main -> whisper-cli bench -> whisper-bench stream -> whisper-stream naredba -> whisper-command server -> whisper-server talk-llama -> whisper-talk-llama
- Uklonjeni primjeri talk i talk.wasm.
- Opcija za suzbijanje negovornih tokena dodana je poslužitelju za šapat.
- Parametar suppress_non_speech_tokens preimenovan je u suppress_nst.
- Opcija no_speech_thold dodana je API-ju i uslužnim programima za postavljanje vjerojatnosti odsutnosti govora na razini segmenta tijekom transkripcije.
- Opcija --suppress_nst je dodana u whisper-cli.
- Ostala poboljšanja i ispravci grešaka.
Izvor: linux.org.ru
