6 января состоялся выпуск 1.7.4 высокопроизводительной системы автоматического распознавания речи whisper.cpp, реализующей модель Whisper от OpenAI, написанной на языках C и C++ и распространяемой по лицензии MIT.
В проекте используется авторская тензорная библиотека машинного обучения GGML, написанная на языке C и оптимизированная для использования различных бэкендов (CUDA, Vulkan, BLAS, SYCL, OpenCL и др.).
Список изменений:
- Переименования исполняемых файлов:
main -> whisper-cli bench -> whisper-bench stream -> whisper-stream command -> whisper-command server -> whisper-server talk-llama -> whisper-talk-llama
- Удалены примеры talk и talk.wasm.
- В whisper-server добавлена опция подавления неречевых лексем.
- Параметр suppress_non_speech_tokens переименован в suppress_nst.
- В API и утилиты добавлена опция no_speech_thold для задания вероятности отсутствия речи на уровне сегмента при транскрипции.
- В whisper-cli добавлена опция —suppress_nst.
- Другие улучшения и исправления ошибок.
Источник: linux.org.ru
