Sistemi i ri optik i njohjes së tekstit EasyOCR

Projekti EasyOCR Po zhvillohet një sistem i ri optik i njohjes së tekstit që mbështet më shumë se 40 gjuhë, duke përfshirë anglisht, gjermanisht, frëngjisht, japonisht, kinezisht, koreanisht, uzbekisht, azerbajxhan dhe lituanisht. Gjuhët e bazuara në cirilik nuk mbështeten ende, por ato po shtohen në listën e planeve. Kodi është shkruar në Python duke përdorur kornizën PyTorch и shperndare nga licencuar sipas Apache 2.0. Për ngarkim sigurohen modele të gatshme për gjuhë të bazuara në alfabetin latin dhe hieroglifet.

Metodat e mësimit të makinerisë përdoren për të identifikuar dhe njohur tekstin në një imazh. Një algoritëm i mësimit të makinës përdoret për të identifikuar tekstin CRAFT (Ndërgjegjësimi i karakterit-rajon për tekst) në zbatimi për PyTorch, i aftë për të theksuar tekstin në objekte arbitrare, duke përfshirë etiketat, shenjat e informacionit dhe shenjat rrugore. Një rrjet nervor i përsëritur konvolucionist përdoret për të njohur sekuencat e karaktereve CRNN (Rrjeti nervor i përsëritur konvolucionist, një kombinim i DCNN dhe RNN) dhe algoritmi CTC BeamSearch CTC BeamSearch (Klasifikimi i përkohshëm lidhës) për të deshifruar daljen e rrjetit nervor në paraqitjen e tekstit.

Burimi: opennet.ru

Shto një koment