Predstavuje sa sada nástrojov Unredacter, ktorá umožňuje obnoviť pôvodný text po jeho skrytí pomocou filtrov založených na pixelácii. Program môže byť napríklad použitý na identifikáciu citlivých údajov a hesiel pixelovaných na snímkach obrazovky alebo snímkach dokumentov. Tvrdí sa, že algoritmus implementovaný v Unredacter je lepší ako predtým dostupné podobné nástroje, ako je Depix, a bol tiež úspešne použitý na absolvovanie testu na identifikáciu pixilovaného textu navrhnutého laboratóriom Jumpsec. Programový kód je napísaný v TypeScript a distribuovaný pod licenciou GPLv3.
Na obnovu textu Unredacter používa metódu spätného výberu, podľa ktorej sa časť pôvodného pixelovaného obrázku porovnáva s variantom syntetizovaným prehľadávaním párov znakov pixelovaných s rôznymi posunmi a zmenenými charakteristikami. Počas vyhľadávania sa postupne vyberie možnosť, ktorá sa najviac zhoduje s pôvodným fragmentom. Pre úspešnú prácu musíte správne uhádnuť veľkosť, typ a parametre odsadenia písma, ako aj vypočítať veľkosť bunky v pixelačnej mriežke a polohu prekrytia mriežky na texte (možnosti odsadenia mriežky sa triedia automaticky) .
Dodatočne si môžeme všimnúť projekt DepixHMM, v rámci ktorého bola pripravená verzia utility Depix, preložená do algoritmu založeného na skrytom Markovovom modeli, vďaka čomu bolo možné zvýšiť presnosť rekonštrukcie symbolov.
Zdroj: opennet.ru