GNU Ocrad 0.28 OCR sistēmas izlaišana

Pēc trīs gadiem kopš pēdējās izlaiduma ir izlaista Ocrad 0.28 (Optical Character Recognition) teksta atpazīšanas sistēma, kas izstrādāta GNU projekta paspārnē. Ocrad var izmantot gan kā bibliotēku OCR funkciju integrēšanai citās lietojumprogrammās, gan kā atsevišķas utilītas, kas, pamatojoties uz ievadei nosūtīto attēlu, veido tekstu UTF-8 vai 8 bitu kodējumos.

Optiskajai atpazīšanai Ocrad izmanto funkciju ekstrakcijas metodi. Ietver lappušu izkārtojuma analizatoru, kas ļauj pareizi atdalīt kolonnas un teksta blokus drukātajos dokumentos. Atpazīšana tiek atbalstīta tikai rakstzīmēm no kodējuma "ascii", "iso-8859-9" un "iso-8859-15" (kirilicas alfabēts netiek atbalstīts).

Tiek atzīmēts, ka jaunajā laidienā ir iekļauta liela daļa nelielu labojumu un uzlabojumu. Būtiskākās izmaiņas bija PNG attēla formāta atbalsts, kas ieviests, izmantojot libpng bibliotēku, kas ievērojami vienkāršoja darbu ar programmu, jo iepriekš varēja ievadīt tikai attēlus PNM formātā.

Avots: opennet.ru

Pievieno komentāru