Vosk kutubxonasida rus tilidagi nutqni aniqlashning yangi modellari

Vosk kutubxonasi ishlab chiquvchilari rus tilidagi nutqni aniqlashning yangi modellarini nashr etishdi: server vosk-model-ru-0.22 va mobil Vosk-model-small-ru-0.22. Modellar yangi nutq ma'lumotlaridan, shuningdek, tanib olish aniqligini 10-20% ga oshirgan yangi neyron tarmoq arxitekturasidan foydalanadi. Kod va ma'lumotlar Apache 2.0 litsenziyasi ostida tarqatiladi.

Muhim o'zgarishlar:

  • Ovozli karnaylarda to'plangan yangi ma'lumotlar masofadan aytilgan nutq buyruqlarini tanib olishni sezilarli darajada yaxshilaydi.
  • Yangi audio chiqarish sxemasi keng polosali yozuvlar uchun tanib olish aniqligini sezilarli darajada yaxshiladi. Shu bilan birga, telefoniyani aniqlashning aniqligi ham yaxshilandi.
  • Lug'at kengaytmasi to'plami murakkab texnik yozuvlarni tanib olishni sozlash imkonini beradi.

Eng yaxshi aniqlik uchun Wax versiyasini 0.3.32 ga yangilash tavsiya etiladi. Sizni Voskning yangi funksiyalari - Unity, Nativescript, Jigasi bilan integratsiya ham qiziqtirishi mumkin. Qozoq va ukrain tillarini tanib olish modellari. Server modeli ishlashi uchun zamonaviy protsessor va 8 Gb xotira talab qilinadi. Mobil model telefonlarda va RaspberryPi 3+ da ishlatilishi mumkin.

Manba: opennet.ru

a Izoh qo'shish