Vosk පුස්තකාලයේ රුසියානු කථන හඳුනාගැනීම සඳහා නව මාදිලි

Vosk පුස්තකාලයේ සංවර්ධකයින් රුසියානු කථන හඳුනාගැනීම සඳහා නව මාදිලි ප්රකාශයට පත් කර ඇත: server vosk-model-ru-0.22 සහ ජංගම Vosk-model-small-ru-0.22. ආකෘති නව කථන දත්ත මෙන්ම නව ස්නායු ජාල ගෘහ නිර්මාණ ශිල්පයක් භාවිතා කරයි, එය හඳුනාගැනීමේ නිරවද්‍යතාවය 10-20% කින් වැඩි කර ඇත. කේතය සහ දත්ත Apache 2.0 බලපත්‍රය යටතේ බෙදා හැරේ.

වැදගත් වෙනස්කම්:

  • හඬ කථිකයන් තුළ එකතු කරන ලද නව දත්ත දුර සිට කථා කරන කථන විධාන හඳුනාගැනීම සැලකිය යුතු ලෙස වැඩි දියුණු කරයි.
  • නව ශ්‍රව්‍ය නිස්සාරණ ක්‍රමය පුළුල් පරාසයක පටිගත කිරීම් සඳහා හඳුනාගැනීමේ නිරවද්‍යතාවය සැලකිය යුතු ලෙස වැඩිදියුණු කර ඇත. ඒ අතරම, දුරකථන හඳුනාගැනීමේ නිරවද්‍යතාවය ද වැඩිදියුණු වී ඇත.
  • ශබ්දකෝෂ දිගු පැකේජය ඔබට සංකීර්ණ තාක්ෂණික වාර්තා හඳුනාගැනීම අභිරුචිකරණය කිරීමට ඉඩ සලසයි.

හොඳම නිරවද්‍යතාවය සඳහා, Wax අනුවාදය 0.3.32 වෙත යාවත්කාලීන කිරීම නිර්දේශ කෙරේ. ඔබ Vosk හි නව විශේෂාංග ගැනද උනන්දු විය හැකිය - Unity, Nativescript, Jigasi සමඟ ඒකාබද්ධ කිරීම. කසකස් සහ යුක්රේන භාෂා හඳුනාගැනීම සඳහා ආකෘති. සේවාදායක ආකෘතිය ක්‍රියාත්මක වීමට නවීන ප්‍රොසෙසරයක් සහ 8GB මතකයක් අවශ්‍ය වේ. ජංගම මාදිලිය දුරකථන සහ RaspberryPi 3+ භාවිතා කළ හැක.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න