Unredacter, ett verktyg för att identifiera pixlad text, introduceras

Unredacter-verktygslådan presenteras, som låter dig återställa den ursprungliga texten efter att ha gömt den med hjälp av filter baserade på pixelering. Till exempel kan programmet användas för att identifiera känsliga data och lösenord pixlade i skärmdumpar eller ögonblicksbilder av dokument. Det påstås att algoritmen som implementerats i Unredacter är överlägsen tidigare tillgängliga liknande verktyg, som Depix, och har också framgångsrikt använts för att klara testet för att identifiera pixlad text som föreslagits av Jumpsec-laboratoriet. Programkoden är skriven i TypeScript och distribueras under GPLv3-licensen.

För att återställa text använder Unredacter den omvända urvalsmetoden, enligt vilken en del av den ursprungliga pixlade bilden jämförs med en variant som syntetiserats genom att söka igenom teckenpar pixlade med olika skiftningar och ändrade egenskaper. Under sökningen väljs gradvis det alternativ som bäst matchar det ursprungliga fragmentet. För att fungera framgångsrikt måste du gissa teckensnittets storlek, typ och indragsparametrar korrekt, samt beräkna cellstorleken i pixeleringsrutnätet och positionen för rutnätsöverlägget på texten (alternativ för rutnätsoffset sorteras ut automatiskt) .

Unredacter, ett verktyg för att identifiera pixlad text, introduceras

Dessutom kan vi notera DepixHMM-projektet, inom ramen för vilket en version av Depix-verktyget förbereddes, översatt till en algoritm baserad på en dold Markov-modell, tack vare vilken det var möjligt att öka noggrannheten i symbolrekonstruktionen.

Källa: opennet.ru

Lägg en kommentar