GNU Ocrad 0.28 OCR tizimining chiqarilishi

Oxirgi nashrdan keyin uch yil o'tgach, GNU loyihasi homiyligida ishlab chiqilgan Ocrad 0.28 (Optik belgilarni aniqlash) matnni aniqlash tizimi chiqarildi. Ocrad-dan OCR funksiyalarini boshqa ilovalarga integratsiyalash uchun kutubxona shaklida ham, kirishga uzatilgan tasvir asosida UTF-8 yoki 8-bitli kodlashlarda matn ishlab chiqaradigan alohida yordamchi dastur shaklida ham foydalanish mumkin.

Optik tanib olish uchun Ocrad xususiyatni ajratib olish usulidan foydalanadi. Chop etilgan hujjatlardagi matn ustunlari va bloklarini to'g'ri ajratish imkonini beruvchi sahifa tartibi analizatorini o'z ichiga oladi. Tanib olish faqat "ascii", "iso-8859-9" va "iso-8859-15" kodlashlaridagi belgilar uchun qo'llab-quvvatlanadi (kirill alifbosi qo'llab-quvvatlanmaydi).

Qayd etilishicha, yangi relizda kichik tuzatishlar va yaxshilanishlarning katta qismi mavjud. Eng muhim o'zgarish libpng kutubxonasi yordamida amalga oshirilgan PNG tasvir formatini qo'llab-quvvatlash edi, bu dastur bilan ishlashni sezilarli darajada soddalashtirdi, chunki ilgari faqat PNM formatidagi rasmlar kiritilishi mumkin edi.

Manba: opennet.ru

a Izoh qo'shish