Utgivelse av GNU Ocrad 0.28 OCR-system

Etter tre år siden forrige utgivelse, har Ocrad 0.28 (Optical Character Recognition) tekstgjenkjenningssystemet, utviklet i regi av GNU-prosjektet, blitt utgitt. Ocrad kan brukes både i form av et bibliotek for å integrere OCR-funksjoner i andre applikasjoner, og i form av et eget verktøy som, basert på bildet som sendes til inngangen, produserer tekst i UTF-8 eller 8-bits koding.

For optisk gjenkjenning bruker Ocrad funksjonsekstraksjonsmetoden. Inkluderer en sidelayoutanalysator som lar deg skille kolonner og tekstblokker på riktig måte i trykte dokumenter. Gjenkjenning støttes bare for tegn fra "ascii", "iso-8859-9" og "iso-8859-15"-kodingene (det er ingen støtte for det kyrilliske alfabetet).

Det bemerkes at den nye utgivelsen inkluderer en stor del av mindre reparasjoner og forbedringer. Den viktigste endringen var støtte for PNG-bildeformatet, implementert ved hjelp av libpng-biblioteket, som i stor grad forenklet arbeidet med programmet, siden tidligere kun bilder i PNM-formater kunne legges inn.

Kilde: opennet.ru

Legg til en kommentar