Introduceret Unredacter, et værktøj til at detektere pixeleret tekst

Unredacter-værktøjssættet præsenteres, som giver dig mulighed for at gendanne den originale tekst efter at have skjult den ved hjælp af filtre baseret på pixelering. For eksempel kan programmet bruges til at identificere følsomme data og adgangskoder pixeleret i skærmbilleder eller snapshots af dokumenter. Det hævdes, at algoritmen implementeret i Unredacter er overlegen i forhold til tidligere tilgængelige lignende hjælpeprogrammer, såsom Depix, og blev også brugt til at bestå testen for at identificere pixileret tekst foreslået af Jumpsec-laboratoriet. Programkoden er skrevet i TypeScript og distribueret under GPLv3-licensen.

For at gendanne tekst bruger Unredacter den omvendte udvælgelsesmetode, hvorefter en del af det originale pixelerede billede sammenlignes med en variant syntetiseret ved at søge gennem tegnpar pixeleret med forskellige skift og ændrede karakteristika. Under søgningen vælges gradvist den mulighed, der passer bedst til det originale fragment. For at fungere med succes skal du gætte skrifttypens størrelse, type og indrykning korrekt, samt beregne cellestørrelsen i pixeleringsgitteret og placeringen af ​​gitteroverlejringen på teksten (indstillinger for gitterforskydning sorteres automatisk fra) .

Introduceret Unredacter, et værktøj til at detektere pixeleret tekst

Derudover kan vi bemærke DepixHMM-projektet, inden for rammerne af hvilket en version af Depix-værktøjet blev udarbejdet, oversat til en algoritme baseret på en skjult Markov-model, takket være hvilken det var muligt at øge nøjagtigheden af ​​symbolrekonstruktion.

Kilde: opennet.ru

Tilføj en kommentar