На 17 и 19 јуни беа објавени верзиите 1.9.0 и 1.9.1 од високо-перформансниот систем за автоматско препознавање на говор. шепот.cpp, имплементирање на моделот шепот од OpenAI и библиотека за машинско учење базирана на тензори GGML и бинарен формат ГГУФ.
Обезбедени се библиотеката libwhisper, демо верзиите и конзолните алатки: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli и parakeet-quantize.
Проектите се напишани во C и C++ и се дистрибуираат под лиценцата MIT.
Промени:
- Додадена е алатката за конзола parakeet-cli, која го поддржува моделот. NVIDIA папагал;
- Поддршката за NVIDIA Parakeet е исто така додадена во обвивката на Ruby.
Некои важни промени направени во средни верзии од вестите шепот.cpp 1.8.0:
- Ракување со исклучоци во C++ во функцијата whisper_init_with_params_no_state;
- Поддршката за ffmpeg е целосно преработена (без користење на GPL код земен од примери на ffmpeg), а употребата на ffmpeg во whisper.cpp е разјаснета;
- Алатката whisper-cli сега има нова опција —version за прикажување на верзијата.
Извор: linux.org.ru




