انتشار سیستم OCR GNU Ocrad 0.28

پس از گذشت سه سال از آخرین نسخه، سیستم تشخیص متن Ocrad 0.28 (تشخیص کاراکتر نوری) که تحت نظارت پروژه گنو توسعه یافته بود، منتشر شد. Ocrad را می توان هم در قالب یک کتابخانه برای ادغام توابع OCR در سایر برنامه ها و هم در قالب یک ابزار مجزا استفاده کرد که بر اساس تصویر ارسال شده به ورودی، متن را در کدهای UTF-8 یا 8 بیتی تولید می کند.

برای تشخیص نوری، Ocrad از روش استخراج ویژگی استفاده می کند. شامل یک تحلیلگر طرح بندی صفحه است که به شما امکان می دهد ستون ها و بلوک های متن را در اسناد چاپ شده به درستی جدا کنید. تشخیص فقط برای نویسه‌های رمزگذاری‌های "ascii"، "iso-8859-9" و "iso-8859-15" پشتیبانی می‌شود (هیچ پشتیبانی از الفبای سیریلیک وجود ندارد).

اشاره شده است که نسخه جدید شامل بخش بزرگی از اصلاحات و بهبودهای جزئی است. مهم‌ترین تغییر پشتیبانی از فرمت تصویر PNG بود که با استفاده از کتابخانه libpng پیاده‌سازی شد، که کار با برنامه را بسیار ساده‌تر کرد، زیرا قبلاً فقط تصاویر در قالب‌های PNM می‌توانستند وارد شوند.

منبع: opennet.ru

اضافه کردن نظر