Ipinakilala ang Unredacter, isang tool para sa pag-detect ng pixelated na text

Ang Unredacter toolkit ay ipinakita, na nagpapahintulot sa iyo na ibalik ang orihinal na teksto pagkatapos itago ito gamit ang mga filter batay sa pixelation. Halimbawa, maaaring gamitin ang program upang matukoy ang sensitibong data at mga password na naka-pixel sa mga screenshot o snapshot ng mga dokumento. Sinasabing ang algorithm na ipinatupad sa Unredacter ay higit na mataas sa dating magagamit na katulad na mga utilidad, tulad ng Depix, at matagumpay ding nagamit upang maipasa ang pagsubok para sa pagtukoy ng pixilated na teksto na iminungkahi ng laboratoryo ng Jumpsec. Ang program code ay nakasulat sa TypeScript at ipinamahagi sa ilalim ng lisensya ng GPLv3.

Upang ibalik ang text, ginagamit ng Unredacter ang reverse selection na paraan, ayon sa kung saan ang isang bahagi ng orihinal na pixelated na imahe ay inihambing sa isang variant na na-synthesize sa pamamagitan ng paghahanap sa mga pares ng mga character na pixelated na may iba't ibang mga shift at mga nabagong katangian. Sa panahon ng paghahanap, ang opsyon na pinaka malapit na tumutugma sa orihinal na fragment ay unti-unting pinipili. Upang matagumpay na gumana, kailangan mong hulaan nang tama ang laki, uri at mga parameter ng indentation ng font, pati na rin kalkulahin ang laki ng cell sa pixelation grid at ang posisyon ng grid overlay sa teksto (ang mga pagpipilian sa grid offset ay awtomatikong inayos) .

Ipinakilala ang Unredacter, isang tool para sa pag-detect ng pixelated na text

Bilang karagdagan, maaari nating tandaan ang proyekto ng DepixHMM, sa loob ng balangkas kung saan inihanda ang isang bersyon ng utility ng Depix, na isinalin sa isang algorithm batay sa isang nakatagong modelo ng Markov, salamat sa kung saan posible na madagdagan ang katumpakan ng muling pagtatayo ng simbolo.

Pinagmulan: opennet.ru

Magdagdag ng komento