เมื่อวันที่ 17 และ 19 มิถุนายน ได้มีการเปิดตัวระบบรู้จำเสียงพูดอัตโนมัติประสิทธิภาพสูงเวอร์ชัน 1.9.0 และ 1.9.1 ตามลำดับ กระซิบ.cppการนำโมเดลไปใช้ กระซิบ จาก OpenAI และไลบรารีการเรียนรู้ของเครื่องแบบอิงเทนเซอร์ จีจีเอ็มแอล และรูปแบบไบนารี จีจียูเอฟ.
มีไลบรารี libwhisper, ตัวอย่างสาธิต และยูทิลิตี้คอนโซลให้ใช้งาน ได้แก่ whisper-bench, whisper-cli, whisper-command, whisper-lsp, whisper-quantize, whisper-server, whisper-stream, whisper-vad-speech-segments, parakeet-cli และ parakeet-quantize
โครงการเหล่านี้เขียนด้วยภาษา C และ C++ และเผยแพร่ภายใต้ใบอนุญาต MIT
การเปลี่ยนแปลง:
- ได้เพิ่มยูทิลิตี้คอนโซล parakeet-cli ซึ่งรองรับโมเดลดังกล่าวแล้ว NVIDIA Parakeet;
- นอกจากนี้ ยังได้เพิ่มการรองรับ NVIDIA Parakeet ลงใน Ruby wrapper แล้วด้วย
มีการเปลี่ยนแปลงที่สำคัญบางประการใน เวอร์ชันระดับกลาง นับตั้งแต่มีข่าว กระซิบ cpp 1.8.0:
- การจัดการข้อยกเว้นใน C++ ในฟังก์ชัน whisper_init_with_params_no_state;
- ส่วนสนับสนุน ffmpeg ได้รับการเขียนใหม่ทั้งหมด (โดยไม่ใช้โค้ด GPL ที่นำมาจากตัวอย่างของ ffmpeg) และการใช้งาน ffmpeg ใน whisper.cpp ได้รับการชี้แจงให้ชัดเจนยิ่งขึ้น
- ยูทิลิตี้ whisper-cli ตอนนี้มีตัวเลือกใหม่คือ —version เพื่อแสดงเวอร์ชัน
ที่มา: linux.org.ru




