Je představen Unredacter, nástroj pro identifikaci pixelovaného textu

Je představena sada nástrojů Unredacter, která umožňuje obnovit původní text po jeho skrytí pomocí filtrů založených na pixelaci. Program lze například použít k identifikaci citlivých dat a hesel pixelovaných na snímcích obrazovky nebo snímků dokumentů. Tvrdí se, že algoritmus implementovaný v Unredacter je lepší než dříve dostupné podobné nástroje, jako je Depix, a byl také úspěšně použit ke splnění testu pro identifikaci pixilovaného textu navrženého laboratoří Jumpsec. Programový kód je napsán v TypeScript a distribuován pod licencí GPLv3.

K obnově textu využívá Unredacter metodu zpětného výběru, podle níž se část původního pixelovaného obrázku porovnává s variantou syntetizovanou prohledáváním dvojic znaků pixelovaných s různými posuny a změněnými charakteristikami. Během vyhledávání se postupně vybírá možnost, která nejvíce odpovídá původnímu fragmentu. Chcete-li úspěšně pracovat, musíte správně odhadnout velikost, typ a parametry odsazení písma, stejně jako vypočítat velikost buňky v mřížce pixelů a polohu překrytí mřížky na textu (možnosti odsazení mřížky se vytřídí automaticky) .

Je představen Unredacter, nástroj pro identifikaci pixelovaného textu

Dále lze zaznamenat projekt DepixHMM, v jehož rámci byla připravena verze utility Depix převedená na algoritmus založený na skrytém Markovově modelu, díky kterému bylo možné zvýšit přesnost rekonstrukce symbolu.

Zdroj: opennet.ru

Přidat komentář