whisper.cpp 1.9.0 y 1.9.1









Los días 17 y 19 de junio se lanzaron las versiones 1.9.0 y 1.9.1 del sistema de reconocimiento automático de voz de alto rendimiento. susurro.cpp, implementando el modelo Susurro de OpenAI y una biblioteca de aprendizaje automático basada en tensores. GGML y formato binario GUF-G.

Se proporcionan la biblioteca libwhisper, demostraciones y utilidades de consola: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli y parakeet-quantize.

Los proyectos están escritos en C y C++ y se distribuyen bajo la licencia MIT.

Cambios:

  • Se ha añadido la utilidad de consola parakeet-cli, que admite el modelo NVIDIA Parakeet;
  • También se ha añadido compatibilidad con NVIDIA Parakeet al envoltorio de Ruby.

Algunos cambios importantes realizados en versiones intermedias desde la noticia susurro.cpp 1.8.0:

  • Manejo de excepciones de C++ en la función whisper_init_with_params_no_state;
  • Se ha reescrito por completo la compatibilidad con ffmpeg (sin utilizar código GPL tomado de los ejemplos de ffmpeg), y se ha aclarado el uso de ffmpeg en whisper.cpp;
  • La utilidad whisper-cli ahora tiene una nueva opción, —version, para mostrar la versión.

Fuente: linux.org.ru

Compre alojamiento confiable para sitios con protección DDoS, servidores VPS VDS 🔥 Compra alojamiento web fiable con protección DDoS, servidores VPS VDS | ProHoster