GNU Ocrad 0.28 OCR -järjestelmän julkaisu

Kolmen vuoden kuluttua edellisestä julkaisusta GNU-projektin alaisuudessa kehitetty Ocrad 0.28 (Optical Character Recognition) -tekstintunnistusjärjestelmä on julkaistu. Ocradia voidaan käyttää sekä kirjastona OCR-toimintojen integroimiseksi muihin sovelluksiin että erillisenä apuohjelmana, joka syötteeseen välitetyn kuvan perusteella tuottaa tekstiä UTF-8- tai 8-bittisillä koodauksilla.

Optiseen tunnistamiseen Ocrad käyttää piirteiden erotusmenetelmää. Sisältää sivuasettelu-analysaattorin, jonka avulla voit erottaa sarakkeet ja tekstilohkot oikein tulostetuissa asiakirjoissa. Tunnistus on tuettu vain "ascii", "iso-8859-9" ja "iso-8859-15"-koodauksen merkeille (kyrillisiä aakkosia ei tueta).

On huomattava, että uusi julkaisu sisältää suuren osan pieniä korjauksia ja parannuksia. Merkittävin muutos oli PNG-kuvamuodon tuki, joka toteutettiin libpng-kirjastolla, mikä yksinkertaisti huomattavasti ohjelman kanssa työskentelyä, koska aiemmin vain PNM-muotoisia kuvia voitiin syöttää.

Lähde: opennet.ru

Lisää kommentti