Unredacter, et verktøy for å identifisere pikselert tekst, introduseres

Unredacter-verktøysettet presenteres, som lar deg gjenopprette den opprinnelige teksten etter å ha skjult den ved hjelp av filtre basert på pikselering. For eksempel kan programmet brukes til å identifisere sensitive data og passord pikselert i skjermbilder eller øyeblikksbilder av dokumenter. Det hevdes at algoritmen implementert i Unredacter er overlegen tidligere tilgjengelige lignende verktøy, for eksempel Depix, og har også blitt brukt til å bestå testen for å identifisere pikselert tekst foreslått av Jumpsec-laboratoriet. Programkoden er skrevet i TypeScript og distribuert under GPLv3-lisensen.

For å gjenopprette tekst bruker Unredacter den omvendte seleksjonsmetoden, ifølge hvilken en del av det originale pikselerte bildet sammenlignes med en variant syntetisert ved å søke gjennom tegnpar pikselert med forskjellige skift og endrede egenskaper. Under søket velges gradvis det alternativet som samsvarer best med det originale fragmentet. For å fungere vellykket, må du gjette størrelsen, typen og innrykkparametrene til skriften, samt beregne cellestørrelsen i pikseleringsrutenettet og posisjonen til rutenettoverlegget på teksten (alternativene for rutenettforskyvning sorteres automatisk ut) .

Unredacter, et verktøy for å identifisere pikselert tekst, introduseres

I tillegg kan vi merke oss DepixHMM-prosjektet, innenfor rammen av hvilket en versjon av Depix-verktøyet ble utarbeidet, oversatt til en algoritme basert på en skjult Markov-modell, takket være hvilken det var mulig å øke nøyaktigheten av symbolrekonstruksjon.

Kilde: opennet.ru

Legg til en kommentar