Ieviests Unredacter — rīks pikseļota teksta noteikšanai

Tiek parādīts Unredacter rīku komplekts, kas ļauj atjaunot sākotnējo tekstu pēc tā paslēpšanas, izmantojot filtrus, kuru pamatā ir pikseļu veidošanās. Piemēram, programmu var izmantot, lai identificētu sensitīvus datus un paroles, kas ir pikselētas dokumentu ekrānuzņēmumos vai momentuzņēmumos. Tiek apgalvots, ka Unredacter ieviestais algoritms ir pārāks par iepriekš pieejamām līdzīgām utilītprogrammām, piemēram, Depix, un ir arī veiksmīgi izmantots, lai izturētu Jumpsec laboratorijas piedāvāto piksilēta teksta identificēšanas testu. Programmas kods ir rakstīts TypeScript un tiek izplatīts saskaņā ar GPLv3 licenci.

Teksta atjaunošanai Unredacter izmanto apgrieztās atlases metodi, saskaņā ar kuru sākotnējā pikseļotā attēla daļa tiek salīdzināta ar variantu, kas sintezēts, meklējot rakstzīmju pārus, kas ir pikselēti ar dažādām nobīdēm un mainītiem raksturlielumiem. Meklēšanas laikā pakāpeniski tiek atlasīta opcija, kas visvairāk atbilst sākotnējam fragmentam. Lai veiksmīgi strādātu, jums ir pareizi jāuzmin fonta lielums, veids un atkāpes parametri, kā arī jāaprēķina šūnas izmērs pikseļu režģī un režģa pārklājuma pozīcija uz teksta (režģa nobīdes opcijas tiek sakārtotas automātiski) .

Ieviests Unredacter — rīks pikseļota teksta noteikšanai

Papildus var atzīmēt projektu DepixHMM, kura ietvaros tika sagatavota Depix utilīta versija, kas pārtulkota uz algoritmu, kura pamatā ir slēptais Markova modelis, pateicoties kuram bija iespējams palielināt simbolu rekonstrukcijas precizitāti.

Avots: opennet.ru

Pievieno komentāru