Lëshimi i sistemit GNU Ocrad 0.28 OCR

Pas tre vjetësh nga publikimi i fundit, sistemi i njohjes së tekstit Ocrad 0.28 (Njohja Optike e Karaktereve), i zhvilluar nën kujdesin e projektit GNU, është lëshuar. Ocrad mund të përdoret si në formën e një biblioteke për integrimin e funksioneve OCR në aplikacione të tjera, ashtu edhe në formën e një mjeti të veçantë që, bazuar në imazhin e kaluar në hyrje, prodhon tekst në kodime UTF-8 ose 8-bit.

Për njohjen optike, Ocrad përdor metodën e nxjerrjes së veçorive. Përfshin një analizues të paraqitjes së faqeve që ju lejon të ndani saktë kolonat dhe blloqet e tekstit në dokumentet e printuara. Njohja mbështetet vetëm për karakteret nga kodimet "ascii", "iso-8859-9" dhe "iso-8859-15" (nuk ka mbështetje për alfabetin cirilik).

Vihet re se versioni i ri përfshin një pjesë të madhe të rregullimeve dhe përmirësimeve të vogla. Ndryshimi më domethënës ishte mbështetja për formatin e imazhit PNG, i zbatuar duke përdorur bibliotekën libpng, e cila thjeshtoi shumë punën me programin, pasi më parë mund të futeshin vetëm imazhe në formatet PNM.

Burimi: opennet.ru

Shto një koment