Unredacter, in ark foar it identifisearjen fan pikselearre tekst, wurdt yntrodusearre

De Unredacter toolkit wurdt presintearre, wêrmei jo de orizjinele tekst kinne weromsette nei't it ferburgen is mei filters basearre op pikselaasje. Bygelyks, it programma kin brûkt wurde om gefoelige gegevens en wachtwurden te identifisearjen pikselearre yn skermôfbyldings of snapshots fan dokuminten. It wurdt beweare dat it algoritme ymplementearre yn Unredacter superieur is oan earder beskikbere ferlykbere nutsbedriuwen, lykas Depix, en waard ek mei súkses brûkt om de test te trochjaan foar it identifisearjen fan pixilearre tekst foarsteld troch it Jumpsec-laboratoarium. De programmakoade is skreaun yn TypeScript en ferspraat ûnder de GPLv3-lisinsje.

Om tekst te herstellen, brûkt Unredacter de metoade foar omkearde seleksje, wêrby't in diel fan 'e orizjinele pikseleare ôfbylding wurdt fergelike mei in fariant dy't syntetisearre is troch te sykjen troch pearen fan karakters pikselearre mei ferskate ferskowings en feroare skaaimerken. Tidens it sykjen wurdt de opsje dy't it meast oerienkomt mei it orizjinele fragmint stadichoan selektearre. Om suksesfol te wurkjen, moatte jo de grutte, type en ynspringparameters fan it lettertype korrekt riede, en ek de selgrutte yn it pikselaasjeraster en de posysje fan 'e rasteroverlay op' e tekst berekkenje (opsjes foar rasteroffset wurde automatysk sorteare) .

Unredacter, in ark foar it identifisearjen fan pikselearre tekst, wurdt yntrodusearre

Derneist kinne wy ​​​​opmerke dat it DepixHMM-projekt, yn it ramt wêrfan in ferzje fan it Depix-hulpprogramma waard taret, oerset nei in algoritme basearre op in ferburgen Markov-model, wêrtroch it mooglik wie om de krektens fan symboalrekonstruksje te fergrutsjen.

Boarne: opennet.ru

Add a comment