Представлено Unredacter, інструмент для визначення пікселізованого тексту

Представлений інструментарій Unredacter, що дозволяє відновити початковий текст після його приховування із застосуванням фільтрів на основі пікселізації. Наприклад, програма може використовуватися для визначення конфіденційних даних та паролів, пікселізованих на скріншотах або знімках документів. Стверджується, що реалізований алгоритм Unredacter перевершує раніше доступні аналогічні утиліти, такі як Depix, і в тому числі успішно використаний для проходження тесту на визначення піксилізованого тексту, запропонованого лабораторією Jumpsec. Код програми написано на TypeScript і розповсюджується під ліцензією GPLv3.

Для відновлення тексту в Unredacter застосовується метод зворотного підбору, відповідно до якого виконується порівняння частини вихідного пікселізованого зображення з варіантом, синтезованим шляхом перебору пар символів, що пікселюються з різними зрушеннями та зміненими характеристиками. У ході перебору поступово підбирається варіант, що найбільше відповідає вихідному фрагменту. Для успішної роботи потрібно правильно вгадати розмір, тип та параметри відступів шрифту, а також обчислити розмір комірки в сітці пікселізації та позицію накладання цієї сітки на текст (варіанти зміщення сітки перебираються автоматично).

Представлено Unredacter, інструмент для визначення пікселізованого тексту

Додатково можна відзначити проект DepixHMM, в рамках якого підготовлено варіант утиліти Depix, переведений на алгоритм на базі прихованої марківської моделі, завдяки якому вдалося досягти підвищення точності відтворення символів.

Джерело: opennet.ru

Додати коментар або відгук