Predstavljen je Unredaktor, alat za prepoznavanje pikseliziranog teksta

Predstavljen je alat Unredacter koji vam omogućuje vraćanje izvornog teksta nakon što ste ga sakrili pomoću filtara temeljenih na pikselizaciji. Na primjer, program se može koristiti za prepoznavanje osjetljivih podataka i lozinki pikseliranih na snimkama zaslona ili snimkama dokumenata. Tvrdi se da je algoritam implementiran u Unredacteru bolji od prethodno dostupnih sličnih uslužnih programa, kao što je Depix, a također je uspješno korišten za prolazak testa za prepoznavanje pikseliziranog teksta koji je predložio laboratorij Jumpsec. Programski kod je napisan u TypeScriptu i distribuiran pod GPLv3 licencom.

Za vraćanje teksta, Unredacter koristi metodu obrnutog odabira, prema kojoj se dio izvorne pikselizirane slike uspoređuje s varijantom sintetiziranom pretraživanjem parova pikseliranih znakova s ​​različitim pomacima i promijenjenim karakteristikama. Tijekom pretraživanja postupno se odabire opcija koja najviše odgovara izvornom fragmentu. Da biste uspješno radili, morate točno pogoditi veličinu, vrstu i parametre uvlačenja fonta, kao i izračunati veličinu ćelije u rešetki pikselizacije i položaj preklapanja rešetke na tekstu (opcije pomaka mreže razvrstavaju se automatski) .

Predstavljen je Unredaktor, alat za prepoznavanje pikseliziranog teksta

Dodatno, možemo istaknuti projekt DepixHMM, u okviru kojeg je pripremljena verzija uslužnog programa Depix, prevedena na algoritam temeljen na skrivenom Markovljevom modelu, zahvaljujući kojem je bilo moguće povećati točnost rekonstrukcije simbola.

Izvor: opennet.ru

Dodajte komentar