Prezentowany jest zestaw narzędzi Unredacter, który pozwala przywrócić oryginalny tekst po ukryciu go za pomocą filtrów opartych na pikselacji. Program może na przykład służyć do identyfikacji wrażliwych danych i haseł podzielonych na piksele na zrzutach ekranu lub migawkach dokumentów. Twierdzi się, że algorytm zaimplementowany w Unredacter jest lepszy od dostępnych wcześniej podobnych narzędzi, takich jak Depix, a także pomyślnie przeszedł test na identyfikację tekstu pikselowanego zaproponowany przez laboratorium Jumpsec. Kod programu napisany jest w języku TypeScript i rozpowszechniany na licencji GPLv3.
Aby przywrócić tekst, Unredacter wykorzystuje metodę odwrotnej selekcji, zgodnie z którą część oryginalnego pikselowanego obrazu jest porównywana z wariantem otrzymanym w wyniku przeszukiwania par znaków pikselowanych z różnymi przesunięciami i zmienionymi cechami. Podczas wyszukiwania stopniowo wybierana jest opcja najbardziej odpowiadająca oryginalnemu fragmentowi. Aby praca przebiegła pomyślnie należy poprawnie odgadnąć parametry rozmiaru, typu i wcięcia czcionki, a także obliczyć wielkość komórki w siatce pikselowania oraz położenie nakładki siatki na tekście (opcje przesunięcia siatki sortowane są automatycznie) .
Dodatkowo na uwagę zasługuje projekt DepixHMM, w ramach którego przygotowano wersję narzędzia Depix przetłumaczoną na algorytm oparty na ukrytym modelu Markowa, dzięki czemu udało się zwiększyć dokładność rekonstrukcji symboli.
Źródło: opennet.ru