Unredacter, testu pixelatua identifikatzeko tresna bat aurkezten da

Unredacter tresna-kit bat aurkezten da, eta horri esker jatorrizko testua leheneratu dezakezu pixelean oinarritutako iragazkiak erabiliz ezkutatu ondoren. Esate baterako, programa erabil daiteke pantaila-argazkietan edo dokumentuen argazkietan pixelatutako datu sentikorrak eta pasahitzak identifikatzeko. Unredacter-en inplementatutako algoritmoa lehen erabilgarri dauden antzeko utilitateen gainetik dagoela esaten da, hala nola Depix, eta Jumpsec laborategiak proposatutako testu pixelatua identifikatzeko proba arrakastaz gainditzeko ere erabili da. Programaren kodea TypeScript-en idatzita dago eta GPLv3 lizentziapean banatzen da.

Testua leheneratzeko, Unredacter-ek alderantzizko hautapen-metodoa erabiltzen du, zeinaren arabera jatorrizko pixelatutako irudiaren zati bat desplazamendu eta ezaugarri ezberdinekin pixelatutako karaktere bikoteen artean bilatuz sintetizatutako aldaera batekin alderatzen da. Bilatzerakoan, jatorrizko zatiarekin gehien bat datorren aukera hautatzen da pixkanaka. Arrakastaz funtzionatzeko, letra-tipoaren tamaina, mota eta koska-parametroak behar bezala asmatu behar dituzu, baita pixelazio-sareko gelaxka-tamaina ere kalkulatu behar dituzu eta sareta gainjartzearen posizioa testuan (sare-desplazamendu aukerak automatikoki ordenatzen dira). .

Unredacter, testu pixelatua identifikatzeko tresna bat aurkezten da

Horrez gain, DepixHMM proiektua nabarmendu daiteke, zeinaren baitan Depix utilitatearen bertsio bat prestatu zen, ezkutuko Markov eredu batean oinarritutako algoritmo batera itzulia, eta horri esker sinboloen berreraikuntzaren zehaztasuna areagotu ahal izan zen.

Iturria: opennet.ru

Gehitu iruzkin berria