Ռուսերեն խոսքի ճանաչման նոր մոդելներ Ոսկե գրադարանում

Vosk գրադարանի մշակողները հրապարակել են ռուսերեն խոսքի ճանաչման նոր մոդելներ՝ սերվերի կողմից vosk-model-ru-0.22 և բջջային Vosk-model-small-ru-0.22: Մոդելներն օգտագործում են նոր խոսքի տվյալներ, ինչպես նաև նեյրոնային ցանցի նոր ճարտարապետություն, որը հնարավորություն է տվել 10-20%-ով բարձրացնել ճանաչման ճշգրտությունը։ Կոդը և տվյալները բաշխվում են Apache 2.0 լիցենզիայի ներքո:

Կարևոր փոփոխություններ.

  • Ձայնային սյունակներում հավաքված նոր տվյալները զգալիորեն բարելավում են հեռվից ասվող խոսքի հրամանների ճանաչումը։
  • Ձայնի արդյունահանման նոր սխեման զգալիորեն բարելավել է լայնաշերտ ձայնագրությունների ճանաչման ճշգրտությունը: Միևնույն ժամանակ բարելավվել է նաև հեռախոսակապի ճանաչման ճշգրտությունը։
  • Բառարանի հավելյալ փաթեթը թույլ է տալիս հարմարեցնել բարդ տեխնիկական գրառումների ճանաչումը:

Լավագույն ճշգրտության համար խորհուրդ է տրվում թարմացնել նաև Wax տարբերակը 0.3.32-ի: Ձեզ կարող են հետաքրքրել նաև Wax-ի նոր հնարավորությունները՝ ինտեգրում Unity, Nativescript, Jigasi-ի հետ: Ղազախերեն և ուկրաիներեն լեզուների ճանաչման մոդելներ. Սերվերի մոդելն աշխատելու համար անհրաժեշտ է ժամանակակից պրոցեսոր և 8 ԳԲ հիշողություն: Բջջային մոդելը կարող է օգտագործվել հեռախոսներում և RaspberryPi 3+-ում։

Source: opennet.ru

Добавить комментарий