Bevezettük az Unredactert, a pixeles szöveg észlelésére szolgáló eszközt

Megjelenik az Unredacter eszközkészlet, amely lehetővé teszi az eredeti szöveg visszaállítását pixelezésen alapuló szűrők segítségével. A program például használható a dokumentumok képernyőképein vagy pillanatképein pixelezett érzékeny adatok és jelszavak azonosítására. Állítólag az Unredacterben megvalósított algoritmus jobb, mint a korábban elérhető hasonló segédprogramok, például a Depix, és sikeresen alkalmazták a Jumpsec laboratóriuma által javasolt pixilált szöveg azonosítására szolgáló teszten is. A programkód TypeScript-ben íródott, és a GPLv3 licenc alatt kerül terjesztésre.

A szöveg visszaállításához az Unredacter a fordított kiválasztási módszert alkalmazza, amely szerint az eredeti pixeles kép egy részét összehasonlítja a különböző eltolódásokkal és megváltozott jellemzőkkel pixelezett karakterpárok közötti kereséssel szintetizált változattal. A keresés során fokozatosan kiválasztásra kerül az eredeti töredéknek leginkább megfelelő opció. A sikeres működéshez helyesen kell kitalálnia a betűtípus méretét, típusát és behúzási paramétereit, valamint ki kell számítania a cellaméretet a pixelációs rácsban és a rácsfedvény pozícióját a szövegen (a rács eltolási opciók automatikusan ki vannak rendezve) .

Bevezettük az Unredactert, a pixeles szöveg észlelésére szolgáló eszközt

Emellett megemlíthetjük a DepixHMM projektet, melynek keretében elkészült a Depix segédprogram egy rejtett Markov-modellre épülő algoritmusra lefordított változata, aminek köszönhetően a szimbólumrekonstrukció pontosságát lehetett növelni.

Forrás: opennet.ru

Hozzászólás