Воск кітапханасында орыс тілін танудың жаңа үлгілері

Vosk кітапханасының әзірлеушілері орыс тілінде сөйлеуді танудың жаңа үлгілерін шығарды: сервер vosk-model-ru-0.22 және мобильді Vosk-model-small-ru-0.22. Модельдер жаңа сөйлеу деректерін, сондай-ақ тану дәлдігін 10-20%-ға арттыратын жаңа нейрондық желі архитектурасын пайдаланады. Код пен деректер Apache 2.0 лицензиясы бойынша таратылады.

Маңызды өзгерістер:

  • Дауыс динамиктерінде жиналған жаңа деректер алыстан айтылған сөйлеу пәрмендерін тануды айтарлықтай жақсартады.
  • Жаңа дыбыс шығару схемасы кең жолақты жазбалар үшін тану дәлдігін айтарлықтай жақсартты. Сонымен қатар, телефонияны тану дәлдігі де жақсарды.
  • Сөздік кеңейтім пакеті күрделі техникалық жазбаларды тануды теңшеуге мүмкіндік береді.

Ең жақсы дәлдік үшін балауыз нұсқасын 0.3.32 нұсқасына жаңарту ұсынылады. Сізді сондай-ақ Vosk-тың жаңа мүмкіндіктері - Unity, Nativescript, Jigasi-мен интеграция қызықтыруы мүмкін. Қазақ және украин тілдерін тану үлгілері. Сервер үлгісі жұмыс істеу үшін заманауи процессор мен 8 ГБ жадты қажет етеді. Мобильді модельді телефондарда және RaspberryPi 3+ жүйесінде қолдануға болады.

Ақпарат көзі: opennet.ru

пікір қалдыру