Nouvo sistèm optik rekonesans tèks EasyOCR

Pwojè EasyOCR Yon nouvo sistèm rekonesans tèks optik ap devlope ki sipòte plis pase 40 lang, tankou angle, Alman, franse, Japonè, Chinwa, Koreyen, Uzbek, Azerbaijan ak Lithuanian. Lang ki baze sou sirilik yo poko sipòte, men yo ajoute yo nan lis plan yo. Kòd la ekri nan Python lè l sèvi avèk fondasyon an PyTorch и distribiye pa ki gen lisans anba Apache 2.0. Pou chaje yo bay yo modèl pare pou lang ki baze sou alfabè Latin ak yeroglif.

Metòd aprantisaj machin yo itilize pou idantifye ak rekonèt tèks nan yon imaj. Yo itilize yon algorithm aprantisaj machin pou idantifye tèks CRAFT (Konsyantizasyon Karaktè-Rejyon Pou Tèks) nan aplikasyon pou PyTorch, kapab mete aksan sou tèks sou objè abitrè, ki gen ladan etikèt, siy enfòmasyon ak siy wout. Yo itilize yon rezo neral konvolusyonèl renouvlab pou rekonèt sekans karaktè CRNN (Convolutional Recurrent Neural Network, yon konbinezon de DCNN ak RNN) ak algorithm CTC BeamSearch CTC BeamSearch (klasifikasyon tanporèl Connectionist) pou dekode pwodiksyon rezo neral nan reprezantasyon tèks.

Sous: opennet.ru

Add nouvo kòmantè