Unredacter, пикселжүүлсэн текстийг илрүүлэх хэрэгсэлийг нэвтрүүлсэн

Unredacter багажийг танилцуулж байгаа бөгөөд энэ нь анхны текстийг пикселжилт дээр суурилсан шүүлтүүр ашиглан нуусны дараа сэргээх боломжийг олгодог. Жишээлбэл, энэ програмыг дэлгэцийн агшин эсвэл баримт бичгийн агшин агшинд пикселжүүлсэн нууц үг, нууц үгийг тодорхойлоход ашиглаж болно. Unredacter-д хэрэгжүүлсэн алгоритм нь Depix гэх мэт өмнө нь байсан ижил төстэй хэрэглүүрүүдээс давуу бөгөөд Jumpsec лабораторийн санал болгосон пиксил текстийг тодорхойлох туршилтыг амжилттай давсан гэж мэдэгджээ. Програмын код нь TypeScript дээр бичигдсэн бөгөөд GPLv3 лицензийн дагуу түгээгддэг.

Текстийг сэргээхийн тулд Unredacter нь урвуу сонголтын аргыг ашигладаг бөгөөд үүний дагуу анхны пикселжүүлсэн зургийн нэг хэсгийг өөр өөр шилжилт, өөрчлөгдсөн шинж чанар бүхий пикселийн хос тэмдэгтүүдийг хайж нэгтгэсэн хувилбартай харьцуулдаг. Хайлтын явцад анхны фрагменттэй хамгийн ойр тохирох сонголтыг аажмаар сонгоно. Амжилттай ажиллахын тулд та үсгийн хэмжээ, төрөл, доголын параметрүүдийг зөв таамаглахаас гадна пикселийн тор дахь нүдний хэмжээ, текст дээрх торны давхаргын байрлалыг тооцоолох хэрэгтэй (сүлжээний офсет сонголтуудыг автоматаар эрэмбэлдэг) .

Unredacter, пикселжүүлсэн текстийг илрүүлэх хэрэгсэлийг нэвтрүүлсэн

Нэмж дурдахад, DepixHMM төслийг тэмдэглэж болно, үүний хүрээнд Depix хэрэгслийн хувилбарыг бэлтгэж, Марковын далд загвар дээр суурилсан алгоритм руу хөрвүүлсэн бөгөөд үүний ачаар тэмдэгтийн сэргээн босголтын нарийвчлалыг нэмэгдүүлэх боломжтой болсон.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх