Nuwe modelle vir Russiese spraakherkenning in die Vosk-biblioteek

Die ontwikkelaars van die Vosk-biblioteek het nuwe modelle vir Russiese spraakherkenning gepubliseer: bediener-kant vosk-model-ru-0.22 en mobiele Vosk-model-small-ru-0.22. Die modelle gebruik nuwe spraakdata, sowel as 'n nuwe neurale netwerkargitektuur, wat dit moontlik gemaak het om herkenningsakkuraatheid met 10-20% te verhoog. Die kode en data word onder die Apache 2.0-lisensie versprei.

Belangrike veranderinge:

  • Die nuwe data wat in die stemkolomme ingesamel word, verbeter aansienlik die herkenning van spraakopdragte wat van 'n afstand gepraat word.
  • Die nuwe klankonttrekkingskema het die herkenningsakkuraatheid vir wyebandopnames aansienlik verbeter. Terselfdertyd het die akkuraatheid van telefonie-herkenning ook verbeter.
  • Die woordeboekbyvoegingspakket laat jou toe om die herkenning van komplekse tegniese inskrywings aan te pas.

Vir die beste akkuraatheid word dit aanbeveel om Wax-weergawe ook op te dateer na 0.3.32. Jy sal dalk ook belangstel in die nuwe Wax-kenmerke - integrasie met Unity, Nativescript, Jigasi. Modelle vir die erkenning van Kazakh en OekraΓ―ens tale. Die bedienermodel benodig 'n moderne verwerker en 8 GB geheue om te werk. Die mobiele model kan in fone en RaspberryPi 3+ gebruik word.

Bron: opennet.ru

Voeg 'n opmerking