Gefa út GNU Ocrad 0.28 OCR kerfi

Eftir þrjú ár frá síðustu útgáfu hefur Ocrad 0.28 (Optical Character Recognition) textagreiningarkerfið, þróað undir merkjum GNU verkefnisins, verið gefið út. Ocrad er hægt að nota bæði í formi bókasafns til að samþætta OCR aðgerðir í önnur forrit og í formi sjálfstæðs tóls sem, byggt á myndinni sem er send til inntaksins, framleiðir texta í UTF-8 eða 8-bita kóðun.

Fyrir sjóngreiningu notar Ocrad eiginleikaútdráttaraðferðina. Inniheldur blaðsíðuútlitsgreiningartæki sem gerir þér kleift að aðskilja dálka og textabubba rétt í prentuðum skjölum. Viðurkenning er aðeins studd fyrir stafi úr „ascii“, „iso-8859-9“ og „iso-8859-15“ kóðun (það er enginn stuðningur við kýrilíska stafrófið).

Það er tekið fram að nýja útgáfan inniheldur stóran hluta af minniháttar lagfæringum og endurbótum. Mikilvægasta breytingin var stuðningur við PNG myndsniðið, útfært með libpng bókasafninu, sem einfaldaði mjög vinnu með forritinu, þar sem áður var aðeins hægt að setja inn myndir á PNM sniði.

Heimild: opennet.ru

Bæta við athugasemd