Unredacter, tól til að bera kennsl á pixlaðan texta, er kynnt

Unredacter verkfærakistan er kynnt, sem gerir þér kleift að endurheimta upprunalega textann eftir að hafa falið hann með því að nota síur byggðar á pixlamyndun. Til dæmis er hægt að nota forritið til að bera kennsl á viðkvæm gögn og lykilorð sem eru pixluð í skjámyndum eða skyndimyndum af skjölum. Fullyrt er að reikniritið sem er útfært í Unredacter sé betra en áður fáanleg sambærileg tól, eins og Depix, og hefur einnig verið notað með góðum árangri til að standast prófið til að bera kennsl á pixilated texta sem Jumpsec rannsóknarstofan lagði til. Forritskóðinn er skrifaður í TypeScript og dreift undir GPLv3 leyfinu.

Til að endurheimta texta notar Unredacter öfuga valaðferð, samkvæmt henni er hluti af upprunalegu pixluðu myndinni borinn saman við afbrigði sem er búið til með því að leita í gegnum pör af stöfum sem eru pixluð með mismunandi tilfærslum og breyttum eiginleikum. Meðan á leitinni stendur er valkosturinn sem passar best við upprunalega brotið smám saman. Til að vinna með góðum árangri þarftu að giska rétt á stærð, gerð og inndráttarfæribreytur leturgerðarinnar, auk þess að reikna út frumastærðina í pixelunarnetinu og staðsetningu töfluyfirlagsins á textanum (valkostir fyrir hnitamótun eru flokkaðir sjálfkrafa út) .

Unredacter, tól til að bera kennsl á pixlaðan texta, er kynnt

Að auki getum við tekið eftir DepixHMM verkefninu, innan ramma þess sem útgáfa af Depix tólinu var unnin, þýtt í reiknirit sem byggt er á földum Markov líkani, þökk sé því hægt að auka nákvæmni endurbyggingar tákna.

Heimild: opennet.ru

Bæta við athugasemd