జూన్ 17 మరియు 19 తేదీలలో, అధిక పనితీరు గల ఆటోమేటిక్ స్పీచ్ రికగ్నిషన్ సిస్టమ్ యొక్క 1.9.0 మరియు 1.9.1 వెర్షన్లు విడుదలయ్యాయి. whisper.cpp, మోడల్ అమలు విష్పర్ OpenAI నుండి, మరియు టెన్సర్-ఆధారిత మెషిన్ లెర్నింగ్ లైబ్రరీ GGML మరియు బైనరీ ఫార్మాట్ GGUF.
libwhisper లైబ్రరీ, డెమోలు మరియు కన్సోల్ యుటిలిటీలు అందించబడ్డాయి: whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli, మరియు parakeet-quantize.
ఈ ప్రాజెక్ట్లు C మరియు C++ భాషలలో వ్రాయబడ్డాయి మరియు MIT లైసెన్స్ క్రింద పంపిణీ చేయబడ్డాయి.
మార్పులు:
- పారాకీట్-క్లి కన్సోల్ యుటిలిటీ జోడించబడింది, ఇది మోడల్కు మద్దతు ఇస్తుంది ఎన్విడియా చిలుక;
- రూబీ వ్రాపర్కు ఎన్విడియా పారాకీట్ మద్దతు కూడా జోడించబడింది.
కొన్ని ముఖ్యమైన మార్పులు చేయబడ్డాయి మధ్యంతర వెర్షన్లు వార్త వచ్చినప్పటి నుండి whisper.cpp 1.8.0:
- whisper_init_with_params_no_state ఫంక్షన్లో C++ ఎక్సెప్షన్ హ్యాండ్లింగ్;
- ffmpeg మద్దతు పూర్తిగా తిరిగి వ్రాయబడింది (ffmpeg ఉదాహరణల నుండి తీసుకున్న GPL కోడ్ను ఉపయోగించకుండా), మరియు whisper.cppలో ffmpeg వాడకం స్పష్టం చేయబడింది;
- విస్పర్-క్లి యుటిలిటీలో ఇప్పుడు వెర్షన్ను ప్రదర్శించడానికి —version అనే కొత్త ఆప్షన్ ఉంది.
మూలం: linux.org.ru




