Nei Modeller fir russesch Ried Unerkennung an der Vosk Bibliothéik

D'Entwéckler vun der Vosk Bibliothéik hunn nei Modeller fir russesch Riederkennung publizéiert: Server vosk-model-ru-0.22 a mobil Vosk-model-small-ru-0.22. D'Modeller benotzen nei Rieddaten, souwéi eng nei neural Netzwierkarchitektur, déi d'Unerkennungsgenauegkeet ëm 10-20% erhéicht huet. De Code an d'Donnéeë ginn ënner der Apache 2.0 Lizenz verdeelt.

Wichteg Ännerungen:

  • Nei Date gesammelt a Stëmmlautsprecher verbesseren d'Unerkennung vu Riedbefehle wesentlech vun enger Distanz geschwat.
  • Den neien Audioextraktiounsschema huet d'Unerkennungsgenauegkeet fir Breetbandopname wesentlech verbessert. Zur selwechter Zäit ass d'Genauegkeet vun der Telefonserkennung och verbessert.
  • D'Wörterbuchverlängerungspaket erlaabt Iech d'Unerkennung vu komplexen technesche Rekorder ze personaliséieren.

Fir déi bescht Genauegkeet ass et recommandéiert d'Wax Versioun op 0.3.32 ze aktualiséieren. Dir kënnt och un déi nei Features vu Vosk interesséiert sinn - Integratioun mat Unity, Nativescript, Jigasi. Modeller fir Kasachesch an Ukrainesch Sproochen ze erkennen. De Servermodell erfuerdert e modernen Prozessor an 8GB Erënnerung fir ze bedreiwen. Den mobilen Modell kann an Telefonen a RaspberryPi 3+ benotzt ginn.

Source: opennet.ru

Setzt e Commentaire