Nýtt ljósfræðilegt textagreiningarkerfi EasyOCR

Verkefni EasyOCR Verið er að þróa nýtt optískt textagreiningarkerfi sem styður meira en 40 tungumál, þar á meðal ensku, þýsku, frönsku, japönsku, kínversku, kóresku, úsbeksku, aserska og litháísku. Tungumál sem byggjast á kýrilísku eru ekki studd enn, en þeim er bætt við listann yfir áætlanir. Kóðinn er skrifaður í Python með því að nota ramma PyTorch и dreift af leyfi samkvæmt Apache 2.0. Til að hlaða eru veittar tilbúnar fyrirmyndir fyrir tungumál byggðar á latneska stafrófinu og híeróglyfum.

Vélnámsaðferðir eru notaðar til að bera kennsl á og þekkja texta í mynd. Vélræn reiknirit er notað til að bera kennsl á texta IÐN (Persónu-svæðisvitund fyrir texta) í framkvæmd fyrir PyTorch, sem er fær um að auðkenna texta á handahófskenndum hlutum, þar með talið merkimiða, upplýsingaskilti og vegskilti. Snúningsbundið endurtekið tauganet er notað til að þekkja stafaraðir CRNN (Convolutional Recurrent Neural Network, sambland af DCNN og RNN) og reiknirit CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) til að afkóða úttak tauganets í textaframsetningu.

Heimild: opennet.ru

Bæta við athugasemd