Unredacter, alat kanggo ngenali teks pixelated, dikenalaké

Toolkit Unredacter ditampilake, sing ngidini sampeyan mulihake teks asli sawise ndhelikake nggunakake saringan adhedhasar piksel. Contone, program kasebut bisa digunakake kanggo ngenali data sensitif lan sandhi kanthi piksel ing gambar utawa potret dokumen. Diklaim yen algoritma sing ditindakake ing Unredacter luwih unggul tinimbang utilitas sing padha, kayata Depix, lan uga wis kasil digunakake kanggo lulus tes kanggo ngenali teks pixilated sing diusulake dening laboratorium Jumpsec. Kode program ditulis ing TypeScript lan disebarake miturut lisensi GPLv3.

Kanggo mulihake teks, Unredacter nggunakake metode pilihan mbalikke, miturut bagean saka gambar piksel asli dibandhingake karo varian sing disintesis kanthi nggoleki pasangan karakter piksel kanthi owah-owahan lan karakteristik sing beda. Sajrone telusuran, opsi sing paling cocog karo fragmen asli dipilih kanthi bertahap. Kanggo sukses, sampeyan kudu ngira ukuran, jinis lan parameter indentasi font kanthi bener, uga ngitung ukuran sel ing kothak piksel lan posisi overlay ing teks (opsi offset grid diurutake kanthi otomatis) .

Unredacter, alat kanggo ngenali teks pixelated, dikenalaké

Kajaba iku, kita bisa nyathet proyek DepixHMM, ing kerangka sing disiapake versi sarana Depix, diterjemahake menyang algoritma adhedhasar model Markov sing didhelikake, amarga bisa nambah akurasi rekonstruksi simbol.

Source: opennet.ru

Add a comment