Nov sistem za optično prepoznavanje besedila EasyOCR

Projekt EasyOCR Razvija se nov sistem za optično prepoznavanje besedila, ki podpira več kot 40 jezikov, vključno z angleščino, nemščino, francoščino, japonščino, kitajščino, korejščino, uzbekistanščino, azerbajdžanskostjo in litovščino. Jeziki, ki temeljijo na cirilici, še niso podprti, vendar se dodajajo na seznam načrtov. Koda je napisana v Pythonu z uporabo ogrodja PyTorch и distributer licenciran pod Apache 2.0. Za nalaganje so na voljo že pripravljeni modeli za jezike, ki temeljijo na latinski abecedi in hieroglifih.

Metode strojnega učenja se uporabljajo za prepoznavanje in prepoznavanje besedila na sliki. Za prepoznavanje besedila se uporablja algoritem strojnega učenja CRAFT (Zavedanje znakovne regije za besedilo) v izvajanje za PyTorch, ki lahko označuje besedilo na poljubnih predmetih, vključno z nalepkami, informacijskimi znaki in prometnimi znaki. Konvolucijska ponavljajoča se nevronska mreža se uporablja za prepoznavanje zaporedij znakov CRNN (Convolutional Recurrent Neural Network, kombinacija DCNN in RNN) in algoritem CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) za dekodiranje izhoda nevronske mreže v predstavitev besedila.

Vir: opennet.ru

Dodaj komentar