EasyOCR жаңы оптикалык текст таануу системасы

долбоор EasyOCR 40тан ашык тилди, анын ичинде англис, немис, француз, жапон, кытай, корей, өзбек, азербайжан жана литва тилдерин колдогон жаңы оптикалык текстти таануу системасы иштелип чыгууда. Кириллицага негизделген тилдер азырынча колдоого алынбайт, бирок алар пландардын тизмесине кошулууда. Код алкактын жардамы менен Python тилинде жазылган PyTorch и жайылуу Apache 2.0 астында лицензияланган. Жүктөө үчүн каралган латын алфавитине жана иероглифтерге негизделген тилдер үчүн даяр моделдер.

Сүрөттөгү текстти аныктоо жана таануу үчүн машина үйрөнүү ыкмалары колдонулат. Текстти аныктоо үчүн машина үйрөнүү алгоритми колдонулат кол өнөрчүлүк (Текст үчүн каарман-региондук кабардар болуу) жылы ишке ашыруу PyTorch үчүн, энбелгилерди, маалымат белгилерин жана жол белгилерин кошо алганда, каалаган объекттердеги текстти бөлүп көрсөтүүгө жөндөмдүү. Символдун ырааттуулугун таануу үчүн конволюциялык рекурренттик нейрон тармагы колдонулат CRNN (Convolutional Recurrent Neural Network, DCNN жана RNN айкалышы) жана алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Убактылуу Классификация) нейрондук тармактын чыгышын тексттик көрсөтүүгө декоддоо үчүн.

Source: opennet.ru

Комментарий кошуу