Lansarea sistemului GNU Ocrad 0.28 OCR

După trei ani de la ultima lansare, a fost lansat sistemul de recunoaștere a textului Ocrad 0.28 (Optical Character Recognition), dezvoltat sub auspiciile proiectului GNU. Ocrad poate fi folosit atât sub forma unei biblioteci pentru integrarea funcțiilor OCR în alte aplicații, cât și sub forma unui utilitar separat care, pe baza imaginii trecute la intrare, produce text în codificări UTF-8 sau 8 biți.

Pentru recunoașterea optică, Ocrad folosește metoda de extracție a caracteristicilor. Include un analizor de aspect de pagină care vă permite să separați corect coloanele și blocurile de text din documentele tipărite. Recunoașterea este acceptată numai pentru caracterele din codificările „ascii”, „iso-8859-9” și „iso-8859-15” (nu există suport pentru alfabetul chirilic).

Este de notat că noua versiune include o mare parte de remedieri și îmbunătățiri minore. Cea mai semnificativă schimbare a fost suportul pentru formatul de imagine PNG, implementat folosind biblioteca libpng, care a simplificat foarte mult lucrul cu programul, deoarece anterior doar imaginile în formatele PNM puteau fi introduse.

Sursa: opennet.ru

Adauga un comentariu