Presentamos Unredacter, unha ferramenta para detectar texto pixelado

Preséntase o conxunto de ferramentas Unredacter, que permite restaurar o texto orixinal despois de ocultalo mediante filtros baseados na pixelación. Por exemplo, o programa pódese usar para identificar datos confidenciais e contrasinais pixelados en capturas de pantalla ou instantáneas de documentos. Afirma que o algoritmo implementado en Unredacter é superior ás utilidades similares dispoñibles anteriormente, como Depix, e tamén se utilizou con éxito para superar a proba de identificación de texto pixelado proposto polo laboratorio Jumpsec. O código do programa está escrito en TypeScript e distribúese baixo a licenza GPLv3.

Para restaurar o texto, Unredacter utiliza o método de selección inversa, segundo o cal se compara unha parte da imaxe pixelada orixinal cunha variante sintetizada mediante a busca en pares de caracteres pixelados con varios desprazamentos e características modificadas. Durante a busca, seleccionouse gradualmente a opción que máis se axusta ao fragmento orixinal. Para funcionar correctamente, cómpre adiviñar correctamente o tamaño, o tipo e os parámetros de sangría da fonte, así como calcular o tamaño da cela na grella de pixelación e a posición da superposición da grella no texto (as opcións de compensación da grella resúltanse automaticamente). .

Presentamos Unredacter, unha ferramenta para detectar texto pixelado

Ademais, podemos sinalar o proxecto DepixHMM, no marco do cal se preparou unha versión da utilidade Depix, traducida a un algoritmo baseado nun modelo de Markov oculto, grazas ao cal foi posible aumentar a precisión da reconstrución de símbolos.

Fonte: opennet.ru

Engadir un comentario