Tutvustatakse piksliga teksti tuvastamise tööriista Unredacter

Esitatakse Unredacteri tööriistakomplekt, mis võimaldab taastada algse teksti pärast selle peitmist, kasutades pikslimisel põhinevaid filtreid. Näiteks saab programmi kasutada tundlike andmete ja paroolide tuvastamiseks, mis on pikslitud dokumentide ekraanipiltidel või hetktõmmistel. Väidetavalt on Unredacteris rakendatud algoritm parem kui varem saadaval olnud sarnased utiliidid, nagu Depix, ja seda on edukalt kasutatud ka Jumpseci labori pakutud piksileeritud teksti tuvastamise testi läbimiseks. Programmi kood on kirjutatud TypeScriptis ja levitatud GPLv3 litsentsi alusel.

Teksti taastamiseks kasutab Unredacter pöördvaliku meetodit, mille kohaselt võrreldakse osa algsest pikslitud pildist variandiga, mis on sünteesitud erinevate nihkete ja muudetud karakteristikutega pikslitud märgipaaride otsimisel. Otsingu käigus valitakse järk-järgult suvand, mis vastab kõige rohkem algsele fragmendile. Edukaks töötamiseks peate õigesti ära arvama fondi suuruse, tüübi ja taande parameetrid, samuti arvutama pikslivõrgustiku lahtri suuruse ja ruudustiku ülekatte asukoha tekstil (ruudustiku nihkevalikud sorteeritakse automaatselt) .

Tutvustatakse piksliga teksti tuvastamise tööriista Unredacter

Lisaks võib märkida projekti DepixHMM, mille raames valmis Depixi utiliidi versioon, mis tõlgiti varjatud Markovi mudelil põhinevale algoritmile, tänu millele oli võimalik sümbolite rekonstrueerimise täpsust suurendada.

Allikas: opennet.ru

Lisa kommentaar