Rilis sistem GNU Ocrad 0.28 OCR

Setelah tiga tahun sejak rilis terakhir, sistem pengenalan teks Ocrad 0.28 (Optical Character Recognition), yang dikembangkan di bawah naungan proyek GNU, telah dirilis. Ocrad dapat digunakan baik sebagai perpustakaan untuk mengintegrasikan fungsi OCR ke dalam aplikasi lain, dan sebagai utilitas terpisah yang, berdasarkan gambar yang diteruskan ke input, menghasilkan teks dalam pengkodean UTF-8 atau 8-bit.

Untuk pengenalan optik, Ocrad menggunakan metode ekstraksi fitur. Termasuk penganalisis tata letak halaman yang memungkinkan Anda memisahkan kolom dan blok teks dengan benar dalam dokumen cetak. Pengenalan hanya didukung untuk karakter dari pengkodean "ascii", "iso-8859-9" dan "iso-8859-15" (tidak ada dukungan untuk alfabet Sirilik).

Perlu dicatat bahwa rilis baru ini mencakup sebagian besar perbaikan dan peningkatan kecil. Perubahan paling signifikan adalah dukungan untuk format gambar PNG, yang diimplementasikan menggunakan perpustakaan libpng, yang sangat menyederhanakan pekerjaan dengan program ini, karena sebelumnya hanya gambar dalam format PNM yang dapat dimasukkan.

Sumber: opennet.ru

Tambah komentar