ಜೂನ್ 17 ಮತ್ತು 19 ರಂದು, ಉನ್ನತ-ಕಾರ್ಯಕ್ಷಮತೆಯ ಸ್ವಯಂಚಾಲಿತ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ವ್ಯವಸ್ಥೆಯ ಆವೃತ್ತಿಗಳು 1.9.0 ಮತ್ತು 1.9.1 ಬಿಡುಗಡೆಯಾದವು. whisper.cpp, ಮಾದರಿಯನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುವುದು ವಿಸ್ಪರ್ OpenAI ನಿಂದ, ಮತ್ತು ಟೆನ್ಸರ್ ಆಧಾರಿತ ಯಂತ್ರ ಕಲಿಕೆ ಗ್ರಂಥಾಲಯದಿಂದ GGML ಮತ್ತು ಬೈನರಿ ಸ್ವರೂಪ ಜಿಜಿಯುಎಫ್.
libwhisper ಲೈಬ್ರರಿ, ಡೆಮೊಗಳು ಮತ್ತು ಕನ್ಸೋಲ್ ಉಪಯುಕ್ತತೆಗಳನ್ನು ಒದಗಿಸಲಾಗಿದೆ: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli, ಮತ್ತು parakeet-quantize.
ಯೋಜನೆಗಳನ್ನು C ಮತ್ತು C++ ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು MIT ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗುತ್ತದೆ.
ಬದಲಾವಣೆಗಳು:
- ಪ್ಯಾರಕೀಟ್-ಕ್ಲೈ ಕನ್ಸೋಲ್ ಸೌಲಭ್ಯವನ್ನು ಸೇರಿಸಲಾಗಿದೆ, ಇದು ಮಾದರಿಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. NVIDIA ಪ್ಯಾರಕೀಟ್;
- ರೂಬಿ ಹೊದಿಕೆಗೆ NVIDIA ಪ್ಯಾರಕೀಟ್ ಬೆಂಬಲವನ್ನು ಸಹ ಸೇರಿಸಲಾಗಿದೆ.
ಕೆಲವು ಪ್ರಮುಖ ಬದಲಾವಣೆಗಳನ್ನು ಮಾಡಲಾಗಿದೆ ಮಧ್ಯಂತರ ಆವೃತ್ತಿಗಳು ಸುದ್ದಿ ಬಂದಾಗಿನಿಂದ whisper.cpp 1.8.0:
- whisper_init_with_params_no_state ಕಾರ್ಯದಲ್ಲಿ C++ ವಿನಾಯಿತಿ ನಿರ್ವಹಣೆ;
- ffmpeg ಬೆಂಬಲವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಪುನಃ ಬರೆಯಲಾಗಿದೆ (ffmpeg ಉದಾಹರಣೆಗಳಿಂದ ತೆಗೆದುಕೊಳ್ಳಲಾದ GPL ಕೋಡ್ ಅನ್ನು ಬಳಸದೆ), ಮತ್ತು whisper.cpp ನಲ್ಲಿ ffmpeg ಬಳಕೆಯನ್ನು ಸ್ಪಷ್ಟಪಡಿಸಲಾಗಿದೆ;
- whisper-cli ಉಪಯುಕ್ತತೆಯು ಈಗ ಆವೃತ್ತಿಯನ್ನು ಪ್ರದರ್ಶಿಸಲು ಆವೃತ್ತಿ ಎಂಬ ಹೊಸ ಆಯ್ಕೆಯನ್ನು ಹೊಂದಿದೆ.
ಮೂಲ: linux.org.ru




