EasyOCR текст таних шинэ оптик систем

Төсөл EasyOCR Англи, Герман, Франц, Япон, Хятад, Солонгос, Узбек, Азербайжан, Литва зэрэг 40 гаруй хэлийг дэмждэг шинэ оптик текст таних системийг боловсруулж байна. Кирилл үсэгт суурилсан хэл хараахан дэмжигдээгүй байгаа ч тэдгээрийг төлөвлөгөөний жагсаалтад нэмж байна. Код нь Python дээр фреймворк ашиглан бичигдсэн ПиТорч и тараасан Apache 2.0 дагуу лицензтэй. Ачаалах зориулалттай хангагдсан байна Латин цагаан толгой, иероглиф дээр суурилсан хэлний бэлэн загварууд.

Зурган дээрх текстийг таних, танихад машин сургалтын аргуудыг ашигладаг. Текстийг тодорхойлохын тулд машин сургалтын алгоритмыг ашигладаг Гар урлал (Текстийн хувьд тэмдэгт-бүс нутгийн мэдлэг) in хэрэгжилт PyTorch-д зориулсан шошго, мэдээллийн тэмдэг, замын тэмдэг зэрэг дурын объектууд дээрх текстийг тодруулах чадвартай. Тэмдэгтүүдийн дарааллыг танихын тулд эргэлтийн мэдрэлийн сүлжээг ашигладаг CRNN (Convolutional Recurrent Neural Network, DCNN болон RNN-ийн хослол) ба алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) нь мэдрэлийн сүлжээний гаралтыг текст дүрслэл болгон тайлах.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх