Nos dias 17 e 19 de junho, foram lançadas as versões 1.9.0 e 1.9.1 do sistema de reconhecimento automático de fala de alto desempenho. sussurro.cpp, implementando o modelo Sussurro da OpenAI e uma biblioteca de aprendizado de máquina baseada em tensores GML e formato binário GGUF.
A biblioteca libwhisper, demonstrações e utilitários de console são fornecidos: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli e parakeet-quantize.
Os projetos são escritos em C e C++ e distribuídos sob a licença MIT.
Mudanças:
- O utilitário de console parakeet-cli foi adicionado, oferecendo suporte ao modelo. Periquito NVIDIA;
- O suporte para NVIDIA Parakeet também foi adicionado ao wrapper Ruby.
Algumas mudanças importantes foram feitas em versões intermediárias desde as notícias sussurro.cpp 1.8.0:
- Tratamento de exceções em C++ na função whisper_init_with_params_no_state;
- O suporte ao ffmpeg foi completamente reescrito (sem usar código GPL retirado de exemplos do ffmpeg), e o uso do ffmpeg em whisper.cpp foi esclarecido;
- O utilitário whisper-cli agora possui uma nova opção —version para exibir a versão.
Fonte: linux.org.ru




