Nuwe optiese teksherkenningstelsel EasyOCR

projek Maklik OCR ’n Nuwe optiese teksherkenningstelsel word ontwikkel wat meer as 40 tale ondersteun, insluitend Engels, Duits, Frans, Japannees, Chinees, Koreaans, Oezbeeks, Azerbeidjans en Litaus. Cyrillies-gebaseerde tale word nog nie ondersteun nie, maar hulle word by die lys planne gevoeg. Die kode word in Python geskryf deur die raamwerk te gebruik PyTorch и versprei deur gelisensieer onder Apache 2.0. Vir laai verskaf word klaargemaakte modelle vir tale gebaseer op die Latynse alfabet en hiërogliewe.

Masjienleermetodes word gebruik om teks in 'n beeld te identifiseer en te herken. 'n Masjienleeralgoritme word gebruik om teks te identifiseer CRAFT (Karakter-streekbewustheid vir teks) in implementering vir PyTorch, in staat om teks op arbitrêre voorwerpe uit te lig, insluitend etikette, inligtingstekens en padtekens. 'n Konvolusionele herhalende neurale netwerk word gebruik om karakterreekse te herken CRNN (Convolutional Recurrent Neural Network, 'n kombinasie van DCNN en RNN) en algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) om neurale netwerkuitset in teksvoorstelling te dekodeer.

Bron: opennet.ru

Voeg 'n opmerking