Je predstavený nástroj Unredacter na identifikáciu pixelovaného textu

Predstavuje sa sada nástrojov Unredacter, ktorá umožňuje obnoviť pôvodný text po jeho skrytí pomocou filtrov založených na pixelácii. Program môže byť napríklad použitý na identifikáciu citlivých údajov a hesiel pixelovaných na snímkach obrazovky alebo snímkach dokumentov. Tvrdí sa, že algoritmus implementovaný v Unredacter je lepší ako predtým dostupné podobné nástroje, ako je Depix, a bol tiež úspešne použitý na absolvovanie testu na identifikáciu pixilovaného textu navrhnutého laboratóriom Jumpsec. Programový kód je napísaný v TypeScript a distribuovaný pod licenciou GPLv3.

Na obnovu textu Unredacter používa metódu spätného výberu, podľa ktorej sa časť pôvodného pixelovaného obrázku porovnáva s variantom syntetizovaným prehľadávaním párov znakov pixelovaných s rôznymi posunmi a zmenenými charakteristikami. Počas vyhľadávania sa postupne vyberie možnosť, ktorá sa najviac zhoduje s pôvodným fragmentom. Pre úspešnú prácu musíte správne uhádnuť veľkosť, typ a parametre odsadenia písma, ako aj vypočítať veľkosť bunky v pixelačnej mriežke a polohu prekrytia mriežky na texte (možnosti odsadenia mriežky sa triedia automaticky) .

Je predstavený nástroj Unredacter na identifikáciu pixelovaného textu

Dodatočne si môžeme všimnúť projekt DepixHMM, v rámci ktorého bola pripravená verzia utility Depix, preložená do algoritmu založeného na skrytom Markovovom modeli, vďaka čomu bolo možné zvýšiť presnosť rekonštrukcie symbolov.

Zdroj: opennet.ru

Pridať komentár