Introduziu o Unredacter, uma ferramenta para detectar texto pixelado

É apresentado o kit de ferramentas Unredacter, que permite restaurar o texto original após ocultá-lo usando filtros baseados em pixelização. Por exemplo, o programa pode ser usado para identificar dados confidenciais e senhas pixeladas em capturas de tela ou instantâneos de documentos. Afirma-se que o algoritmo implementado no Unredacter é superior a utilitários semelhantes disponíveis anteriormente, como o Depix, e também foi usado com sucesso para passar no teste de identificação de texto pixelizado proposto pelo laboratório Jumpsec. O código do programa é escrito em TypeScript e distribuído sob a licença GPLv3.

Para restaurar o texto, o Unredacter utiliza o método de seleção reversa, segundo o qual uma parte da imagem pixelizada original é comparada com uma variante sintetizada pela busca em pares de caracteres pixelizados com diferentes deslocamentos e características alteradas. Durante a busca, a opção que mais se aproxima do fragmento original é selecionada gradativamente. Para funcionar com sucesso, você precisa adivinhar corretamente os parâmetros de tamanho, tipo e recuo da fonte, bem como calcular o tamanho da célula na grade de pixelização e a posição da sobreposição da grade no texto (as opções de deslocamento da grade são classificadas automaticamente) .

Introduziu o Unredacter, uma ferramenta para detectar texto pixelado

Adicionalmente, podemos destacar o projeto DepixHMM, no âmbito do qual foi preparada uma versão do utilitário Depix, traduzida para um algoritmo baseado num modelo oculto de Markov, graças ao qual foi possível aumentar a precisão da reconstrução de símbolos.

Fonte: opennet.ru

Adicionar um comentário