Vosk kutubxonasi ishlab chiquvchilari rus tilidagi nutqni aniqlashning yangi modellarini nashr etishdi: server vosk-model-ru-0.22 va mobil Vosk-model-small-ru-0.22. Modellar yangi nutq ma'lumotlaridan, shuningdek, tanib olish aniqligini 10-20% ga oshirgan yangi neyron tarmoq arxitekturasidan foydalanadi. Kod va ma'lumotlar Apache 2.0 litsenziyasi ostida tarqatiladi.
Muhim o'zgarishlar:
- Ovozli karnaylarda to'plangan yangi ma'lumotlar masofadan aytilgan nutq buyruqlarini tanib olishni sezilarli darajada yaxshilaydi.
- Yangi audio chiqarish sxemasi keng polosali yozuvlar uchun tanib olish aniqligini sezilarli darajada yaxshiladi. Shu bilan birga, telefoniyani aniqlashning aniqligi ham yaxshilandi.
- Lug'at kengaytmasi to'plami murakkab texnik yozuvlarni tanib olishni sozlash imkonini beradi.
Eng yaxshi aniqlik uchun Wax versiyasini 0.3.32 ga yangilash tavsiya etiladi. Sizni Voskning yangi funksiyalari - Unity, Nativescript, Jigasi bilan integratsiya ham qiziqtirishi mumkin. Qozoq va ukrain tillarini tanib olish modellari. Server modeli ishlashi uchun zamonaviy protsessor va 8 Gb xotira talab qilinadi. Mobil model telefonlarda va RaspberryPi 3+ da ishlatilishi mumkin.
Manba: opennet.ru