Ħruġ tas-sistema GNU Ocrad 0.28 OCR

Wara tliet snin mill-aħħar rilaxx, is-sistema ta 'rikonoxximent tat-test Ocrad 0.28 (Optical Character Recognition), żviluppata taħt l-awspiċji tal-proġett GNU, ġiet rilaxxata. Ocrad jista' jintuża kemm fil-forma ta' librerija għall-integrazzjoni ta' funzjonijiet OCR f'applikazzjonijiet oħra, kif ukoll fil-forma ta' utilità waħedha li, abbażi tal-immaġni mgħoddija lill-input, tipproduċi test f'UTF-8 jew 8-bit. kodifikazzjonijiet.

Għal rikonoxximent ottiku, Ocrad juża l-metodu ta 'estrazzjoni tal-karatteristiċi. Jinkludi analizzatur tat-tqassim tal-paġna li jippermettilek tissepara b'mod korrett kolonni u blokki ta' test f'dokumenti stampati. Ir-rikonoxximent huwa appoġġjat biss għal karattri mill-kodifikazzjonijiet "ascii", "iso-8859-9" u "iso-8859-15" (m'hemm l-ebda appoġġ għall-alfabett Ċirilliku).

Ta' min jinnota li r-rilaxx il-ġdid jinkludi porzjon kbir ta' tiswija u titjib minuri. L-aktar bidla sinifikanti kienet l-appoġġ għall-format tal-immaġni PNG, implimentat bl-użu tal-librerija libpng, li ssimplifikat ħafna l-ħidma mal-programm, peress li qabel setgħu biss jiddaħħlu immaġini f'formati PNM.

Sors: opennet.ru

Żid kumment