Itusilẹ ti GNU Ocrad 0.28 OCR eto

Lẹhin ọdun mẹta lati igbasilẹ ti o kẹhin, Ocrad 0.28 (Optical Character Recognition) eto idanimọ ọrọ, ti o dagbasoke labẹ awọn atilẹyin ti iṣẹ akanṣe GNU, ti tu silẹ. Ocrad le ṣee lo mejeeji ni irisi ile-ikawe fun sisọpọ awọn iṣẹ OCR sinu awọn ohun elo miiran, ati ni irisi ohun elo lọtọ ti, da lori aworan ti o kọja si titẹ sii, ṣe agbejade ọrọ ni UTF-8 tabi awọn koodu 8-bit.

Fun idanimọ opiti, Ocrad nlo ọna isediwon ẹya. Pẹlu olutupalẹ iṣeto oju-iwe kan ti o fun ọ laaye lati ya awọn ọwọn lọtọ ati awọn bulọọki ọrọ ni deede ni awọn iwe aṣẹ ti a tẹjade. Idanimọ jẹ atilẹyin nikan fun awọn kikọ lati “ascii”, “iso-8859-9” ati “iso-8859-15” (ko si atilẹyin fun alfabeti Cyrillic).

O ṣe akiyesi pe idasilẹ tuntun pẹlu ipin nla ti awọn atunṣe kekere ati awọn ilọsiwaju. Iyipada ti o ṣe pataki julọ ni atilẹyin fun ọna kika aworan PNG, ti a ṣe ni lilo ile-ikawe libpng, eyiti o rọrun pupọ lati ṣiṣẹ pẹlu eto naa, nitori iṣaaju awọn aworan nikan ni awọn ọna kika PNM le jẹ titẹ sii.

orisun: opennet.ru

Fi ọrọìwòye kun