GNU Ocrad 0.28 OCR سسٹم کا اجراء

آخری ریلیز کے تین سال بعد، Ocrad 0.28 (آپٹیکل کریکٹر ریکگنیشن) ٹیکسٹ ریکگنیشن سسٹم، جو GNU پروجیکٹ کے زیر اہتمام تیار کیا گیا ہے، جاری کیا گیا ہے۔ Ocrad کو OCR فنکشنز کو دیگر ایپلی کیشنز میں ضم کرنے کے لیے لائبریری کی شکل میں اور ایک علیحدہ یوٹیلیٹی کی شکل میں دونوں طرح استعمال کیا جا سکتا ہے جو کہ ان پٹ کو دی گئی تصویر کی بنیاد پر UTF-8 یا 8-bit انکوڈنگز میں متن تیار کرتی ہے۔

نظری شناخت کے لیے، Ocrad فیچر نکالنے کا طریقہ استعمال کرتا ہے۔ صفحہ لے آؤٹ تجزیہ کار پر مشتمل ہے جو آپ کو پرنٹ شدہ دستاویزات میں کالم اور متن کے بلاکس کو درست طریقے سے الگ کرنے کی اجازت دیتا ہے۔ شناخت صرف "ascii"، "iso-8859-9" اور "iso-8859-15" انکوڈنگز کے حروف کے لیے معاون ہے (سیریلک حروف تہجی کے لیے کوئی تعاون نہیں ہے)۔

واضح رہے کہ نئی ریلیز میں معمولی اصلاحات اور بہتری کا ایک بڑا حصہ شامل ہے۔ سب سے اہم تبدیلی PNG امیج فارمیٹ کے لیے سپورٹ تھی، جسے libpng لائبریری کا استعمال کرتے ہوئے لاگو کیا گیا تھا، جس نے پروگرام کے ساتھ کام کرنا بہت آسان بنا دیا تھا، کیونکہ پہلے صرف PNM فارمیٹس میں تصاویر ہی ان پٹ ہو سکتی تھیں۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں