در ۱۷ و ۱۹ ژوئن، نسخههای ۱.۹.۰ و ۱.۹.۱ از سیستم تشخیص گفتار خودکار با عملکرد بالا منتشر شدند. whisper.cpp، پیاده سازی مدل نجوا از OpenAI و یک کتابخانه یادگیری ماشین مبتنی بر تانسور GGML و فرمت باینری جی جی اف.
کتابخانه، دموها و ابزارهای کنسول libwhisper ارائه شدهاند: whisper-bench، whisper-cli، whisper-command، whisper-lsp، whisper-quantize، whisper-server، whisper-stream، whisper-vad-speech-segments، parakeet-cli و parakeet-quantize.
این پروژهها با زبانهای C و C++ نوشته شدهاند و تحت مجوز MIT منتشر شدهاند.
تغییرات:
- ابزار کنسول parakeet-cli اضافه شده است که از مدل پشتیبانی میکند. طوطی کوچک انویدیا;
- پشتیبانی از NVIDIA Parakeet نیز به بستهبندی Ruby اضافه شده است.
برخی از تغییرات مهم ایجاد شده در نسخههای میانی از زمان انتشار خبر whisper.cpp 1.8.0:
- مدیریت استثنا در C++ در تابع whisper_init_with_params_no_state؛
- پشتیبانی از ffmpeg به طور کامل بازنویسی شده است (بدون استفاده از کد GPL که از نمونههای ffmpeg گرفته شده است)، و نحوهی استفاده از ffmpeg در whisper.cpp شفافسازی شده است؛
- ابزار whisper-cli اکنون گزینه جدیدی به نام version برای نمایش نسخه دارد.
منبع: linux.org.ru




