Einführung von Unredacter, einem Tool zur Erkennung von verpixeltem Text

Es wird das Unredacter-Toolkit vorgestellt, mit dem Sie den Originaltext wiederherstellen können, nachdem Sie ihn mithilfe von auf Pixelierung basierenden Filtern ausgeblendet haben. Beispielsweise können mit dem Programm sensible Daten und Passwörter verpixelt in Screenshots oder Schnappschüssen von Dokumenten identifiziert werden. Es wird behauptet, dass der in Unredacter implementierte Algorithmus zuvor verfügbaren ähnlichen Dienstprogrammen wie Depix überlegen ist und auch erfolgreich verwendet wurde, um den vom Jumpsec-Labor vorgeschlagenen Test zur Identifizierung von pixeligem Text zu bestehen. Der Programmcode ist in TypeScript geschrieben und wird unter der GPLv3-Lizenz vertrieben.

Um Text wiederherzustellen, verwendet Unredacter die umgekehrte Auswahlmethode, bei der ein Teil des ursprünglichen pixelierten Bildes mit einer Variante verglichen wird, die durch Durchsuchen von Pixelpaaren mit unterschiedlichen Verschiebungen und veränderten Eigenschaften synthetisiert wurde. Während der Suche wird nach und nach die Option ausgewählt, die am ehesten zum Originalfragment passt. Um erfolgreich zu arbeiten, müssen Sie die Größen-, Typ- und Einrückungsparameter der Schriftart richtig erraten sowie die Zellengröße im Pixelraster und die Position der Rasterüberlagerung auf dem Text berechnen (Rasterversatzoptionen werden automatisch sortiert). .

Einführung von Unredacter, einem Tool zur Erkennung von verpixeltem Text

Darüber hinaus können wir das DepixHMM-Projekt erwähnen, in dessen Rahmen eine Version des Depix-Dienstprogramms erstellt wurde, die in einen Algorithmus übersetzt wurde, der auf einem Hidden-Markov-Modell basiert, dank dessen es möglich war, die Genauigkeit der Symbolrekonstruktion zu erhöhen.

Source: opennet.ru

Kommentar hinzufügen