Viene introdotto Unredacter, uno strumento per identificare il testo pixelato

Viene presentato il toolkit Unredacter, che permette di ripristinare il testo originale dopo averlo nascosto utilizzando filtri basati sulla pixelizzazione. Ad esempio, il programma può essere utilizzato per identificare dati sensibili e password pixelate in screenshot o istantanee di documenti. Si sostiene che l'algoritmo implementato in Unredacter sia superiore a utility simili precedentemente disponibili, come Depix, ed è stato anche utilizzato con successo per superare il test per l'identificazione del testo pixellato proposto dal laboratorio Jumpsec. Il codice del programma è scritto in TypeScript e distribuito sotto la licenza GPLv3.

Per ripristinare il testo, Unredacter utilizza il metodo della selezione inversa, secondo il quale una parte dell'immagine pixelata originale viene confrontata con una variante sintetizzata cercando tra coppie di caratteri pixelati con spostamenti diversi e caratteristiche modificate. Durante la ricerca viene gradualmente selezionata l'opzione che più si avvicina al frammento originale. Per funzionare correttamente, è necessario indovinare correttamente i parametri di dimensione, tipo e rientro del carattere, nonché calcolare la dimensione della cella nella griglia di pixelizzazione e la posizione della sovrapposizione della griglia sul testo (le opzioni di offset della griglia vengono ordinate automaticamente) .

Viene introdotto Unredacter, uno strumento per identificare il testo pixelato

Inoltre, possiamo notare il progetto DepixHMM, nell'ambito del quale è stata preparata una versione dell'utilità Depix, tradotta in un algoritmo basato su un modello Markov nascosto, grazie al quale è stato possibile aumentare la precisione della ricostruzione dei simboli.

Fonte: opennet.ru

Aggiungi un commento