پس از گذشت سه سال از آخرین نسخه، سیستم تشخیص متن Ocrad 0.28 (تشخیص کاراکتر نوری) که تحت نظارت پروژه گنو توسعه یافته بود، منتشر شد. Ocrad را می توان هم در قالب یک کتابخانه برای ادغام توابع OCR در سایر برنامه ها و هم در قالب یک ابزار مجزا استفاده کرد که بر اساس تصویر ارسال شده به ورودی، متن را در کدهای UTF-8 یا 8 بیتی تولید می کند.
برای تشخیص نوری، Ocrad از روش استخراج ویژگی استفاده می کند. شامل یک تحلیلگر طرح بندی صفحه است که به شما امکان می دهد ستون ها و بلوک های متن را در اسناد چاپ شده به درستی جدا کنید. تشخیص فقط برای نویسههای رمزگذاریهای "ascii"، "iso-8859-9" و "iso-8859-15" پشتیبانی میشود (هیچ پشتیبانی از الفبای سیریلیک وجود ندارد).
اشاره شده است که نسخه جدید شامل بخش بزرگی از اصلاحات و بهبودهای جزئی است. مهمترین تغییر پشتیبانی از فرمت تصویر PNG بود که با استفاده از کتابخانه libpng پیادهسازی شد، که کار با برنامه را بسیار سادهتر کرد، زیرا قبلاً فقط تصاویر در قالبهای PNM میتوانستند وارد شوند.
منبع: opennet.ru