Wprowadzono Unredacter, narzędzie do identyfikacji tekstu pikselowanego

Prezentowany jest zestaw narzędzi Unredacter, który pozwala przywrócić oryginalny tekst po ukryciu go za pomocą filtrów opartych na pikselacji. Program może na przykład służyć do identyfikacji wrażliwych danych i haseł podzielonych na piksele na zrzutach ekranu lub migawkach dokumentów. Twierdzi się, że algorytm zaimplementowany w Unredacter jest lepszy od dostępnych wcześniej podobnych narzędzi, takich jak Depix, a także pomyślnie przeszedł test na identyfikację tekstu pikselowanego zaproponowany przez laboratorium Jumpsec. Kod programu napisany jest w języku TypeScript i rozpowszechniany na licencji GPLv3.

Aby przywrócić tekst, Unredacter wykorzystuje metodę odwrotnej selekcji, zgodnie z którą część oryginalnego pikselowanego obrazu jest porównywana z wariantem otrzymanym w wyniku przeszukiwania par znaków pikselowanych z różnymi przesunięciami i zmienionymi cechami. Podczas wyszukiwania stopniowo wybierana jest opcja najbardziej odpowiadająca oryginalnemu fragmentowi. Aby praca przebiegła pomyślnie należy poprawnie odgadnąć parametry rozmiaru, typu i wcięcia czcionki, a także obliczyć wielkość komórki w siatce pikselowania oraz położenie nakładki siatki na tekście (opcje przesunięcia siatki sortowane są automatycznie) .

Wprowadzono Unredacter, narzędzie do identyfikacji tekstu pikselowanego

Dodatkowo na uwagę zasługuje projekt DepixHMM, w ramach którego przygotowano wersję narzędzia Depix przetłumaczoną na algorytm oparty na ukrytym modelu Markowa, dzięki czemu udało się zwiększyć dokładność rekonstrukcji symboli.

Źródło: opennet.ru

Dodaj komentarz