Παρουσιάστηκε το Unredacter, ένα εργαλείο για την ανίχνευση κειμένου με εικονοστοιχεία

Παρουσιάζεται η εργαλειοθήκη Unredacter, η οποία σας επιτρέπει να επαναφέρετε το αρχικό κείμενο αφού το αποκρύψετε χρησιμοποιώντας φίλτρα που βασίζονται σε pixelation. Για παράδειγμα, το πρόγραμμα μπορεί να χρησιμοποιηθεί για τον εντοπισμό ευαίσθητων δεδομένων και κωδικών πρόσβασης με pixel σε στιγμιότυπα οθόνης ή στιγμιότυπα εγγράφων. Υποστηρίζεται ότι ο αλγόριθμος που υλοποιείται στο Unredacter είναι ανώτερος από προηγούμενα διαθέσιμα παρόμοια βοηθητικά προγράμματα, όπως το Depix, και έχει επίσης χρησιμοποιηθεί με επιτυχία για να περάσει το τεστ αναγνώρισης pixilated κειμένου που προτείνεται από το εργαστήριο Jumpsec. Ο κώδικας προγράμματος είναι γραμμένος σε TypeScript και διανέμεται με την άδεια GPLv3.

Για την επαναφορά κειμένου, το Unredacter χρησιμοποιεί τη μέθοδο αντίστροφης επιλογής, σύμφωνα με την οποία ένα μέρος της αρχικής εικόνας με εικονοστοιχεία συγκρίνεται με μια παραλλαγή που συντίθεται μέσω αναζήτησης ζευγών χαρακτήρων με εικονοστοιχεία με διαφορετικές μετατοπίσεις και αλλαγμένα χαρακτηριστικά. Κατά τη διάρκεια της αναζήτησης, επιλέγεται σταδιακά η επιλογή που ταιριάζει περισσότερο με το αρχικό κομμάτι. Για να εργαστείτε με επιτυχία, πρέπει να μαντέψετε σωστά τις παραμέτρους μεγέθους, τύπου και εσοχής της γραμματοσειράς, καθώς και να υπολογίσετε το μέγεθος κελιού στο πλέγμα εικονοστοιχείων και τη θέση της επικάλυψης πλέγματος στο κείμενο (οι επιλογές μετατόπισης πλέγματος ταξινομούνται αυτόματα) .

Παρουσιάστηκε το Unredacter, ένα εργαλείο για την ανίχνευση κειμένου με εικονοστοιχεία

Επιπλέον, μπορούμε να σημειώσουμε το έργο DepixHMM, στο πλαίσιο του οποίου ετοιμάστηκε μια έκδοση του βοηθητικού προγράμματος Depix, μεταφρασμένη σε έναν αλγόριθμο που βασίζεται σε ένα κρυφό μοντέλο Markov, χάρη στο οποίο ήταν δυνατό να αυξηθεί η ακρίβεια της ανακατασκευής συμβόλων.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο