Ngaleupaskeun sistem GNU Ocrad 0.28 OCR

Sanggeus tilu taun ti saprak release panungtungan, sistem pangakuan téks Ocrad 0.28 (Pangakuan Karakter Optik), dimekarkeun dina naungan proyék GNU, geus dirilis. Ocrad tiasa dianggo duanana dina bentuk perpustakaan pikeun ngahijikeun fungsi OCR kana aplikasi anu sanés, sareng dina bentuk utilitas anu misah anu, dumasar kana gambar anu dikirimkeun kana input, ngahasilkeun téks dina encodings UTF-8 atanapi 8-bit.

Pikeun pangakuan optik, Ocrad ngagunakeun métode ékstraksi fitur. Ngawengku analisa perenah halaman anu ngamungkinkeun anjeun leres misahkeun kolom sareng blok téks dina dokumén anu dicitak. Pangenal dirojong ngan pikeun karakter tina encodings "ascii", "iso-8859-9" sareng "iso-8859-15" (teu aya dukungan pikeun alfabét Sirilik).

Catet yén sékrési énggal kalebet sabagian ageung perbaikan sareng perbaikan minor. Parobihan anu paling penting nyaéta dukungan pikeun format gambar PNG, dilaksanakeun nganggo perpustakaan libpng, anu saderhana pisan pikeun damel sareng program, sabab sateuacana ngan ukur gambar dina format PNM tiasa janten input.

sumber: opennet.ru

Tambahkeun komentar