🥇whisper.cpp 1.7.4

6 января состоялся выпуск 1.7.4 высокопроизводительной системы автоматического распознавания речи whisper.cpp, реализующей модель Whisper от OpenAI, написанной на языках C и C++ и распространяемой по лицензии MIT.

В проекте используется авторская тензорная библиотека машинного обучения GGML, написанная на языке C и оптимизированная для использования различных бэкендов (CUDA, Vulkan, BLAS, SYCL, OpenCL и др.).

Список изменений:

Переименования исполняемых файлов:

main -> whisper-cli bench -> whisper-bench stream -> whisper-stream command -> whisper-command server -> whisper-server talk-llama -> whisper-talk-llama

Удалены примеры talk и talk.wasm.
В whisper-server добавлена опция подавления неречевых лексем.
Параметр suppress_non_speech_tokens переименован в suppress_nst.
В API и утилиты добавлена опция no_speech_thold для задания вероятности отсутствия речи на уровне сегмента при транскрипции.
В whisper-cli добавлена опция —suppress_nst.
Другие улучшения и исправления ошибок.

Источник: linux.org.ru