W dniach 17 i 19 czerwca udostępniono wersje 1.9.0 i 1.9.1 wydajnego systemu automatycznego rozpoznawania mowy. szept.cpp, wdrażając model Szept z OpenAI i biblioteki uczenia maszynowego opartej na tensorze GGML i formacie binarnym GGUF.
Dostępne są biblioteka libwhisper, dema i narzędzia konsolowe: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli i parakeet-quantize.
Projekty są napisane w językach C i C++ i rozpowszechniane na licencji MIT.
Zmiany:
- Dodano narzędzie konsoli parakeet-cli, obsługujące model NVIDIA Parakeet;
- Obsługę NVIDIA Parakeet dodano również do wrappera Ruby.
Wprowadzono kilka ważnych zmian wersje pośrednie od czasu wiadomości szept.cpp 1.8.0:
- Obsługa wyjątków C++ w funkcji whisper_init_with_params_no_state;
- Obsługa ffmpeg została całkowicie przepisana (bez użycia kodu GPL zaczerpniętego z przykładów ffmpeg), a sposób użycia ffmpeg w whisper.cpp został wyjaśniony;
- Narzędzie whisper-cli ma teraz nową opcję —version, umożliwiającą wyświetlanie wersji.
Źródło: linux.org.ru




