ٹیکسٹ ریکگنیشن سسٹم ٹیسریکٹ 5.2 کی ریلیز

Tesseract 5.2 آپٹیکل ٹیکسٹ ریکگنیشن سسٹم کا اجراء شائع کیا گیا ہے، جو روسی، قازق، بیلاروسی اور یوکرینی سمیت 8 سے زائد زبانوں میں UTF-100 حروف اور متن کی شناخت میں معاون ہے۔ نتیجہ سادہ متن میں یا HTML (hOCR)، ALTO (XML)، PDF اور TSV فارمیٹس میں محفوظ کیا جا سکتا ہے۔ یہ نظام اصل میں 1985-1995 میں ہیولٹ پیکارڈ لیبارٹری میں بنایا گیا تھا؛ 2005 میں، کوڈ کو اپاچی لائسنس کے تحت کھولا گیا تھا اور اسے گوگل کے ملازمین کی شرکت سے مزید تیار کیا گیا تھا۔ پروجیکٹ کا سورس کوڈ اپاچی 2.0 لائسنس کے تحت تقسیم کیا گیا ہے۔

Tesseract میں دیگر ایپلی کیشنز میں OCR فعالیت کو سرایت کرنے کے لیے کنسول یوٹیلیٹی اور libtesseract لائبریری شامل ہے۔ تھرڈ پارٹی GUI انٹرفیس جو Tesseract کو سپورٹ کرتے ہیں ان میں gImageReader، VietOCR اور YAGF شامل ہیں۔ دو شناختی انجن پیش کیے جاتے ہیں: ایک کلاسک جو انفرادی کریکٹر پیٹرن کی سطح پر متن کو پہچانتا ہے، اور ایک نیا LSTM ریکرنٹ نیورل نیٹ ورک پر مبنی مشین لرننگ سسٹم کے استعمال پر مبنی ہے، جو پوری تاروں کو پہچاننے کے لیے موزوں ہے اور اس کی اجازت دیتا ہے۔ درستگی میں نمایاں اضافہ۔ 123 زبانوں کے لیے تیار شدہ تربیت یافتہ ماڈل شائع کیے گئے ہیں۔ کارکردگی کو بہتر بنانے کے لیے، OpenMP اور SIMD ہدایات AVX2، AVX، AVX512F، NEON یا SSE4.1 استعمال کرنے والے ماڈیولز پیش کیے جاتے ہیں۔

Tesseract 5.2 میں اہم بہتری:

  • Intel AVX512F ہدایات کا استعمال کرتے ہوئے لاگو کردہ اضافی اصلاحات۔
  • C API میموری سے مشین لرننگ ماڈل لوڈ کرنے کے ساتھ ٹیسریکٹ کو شروع کرنے کے لیے ایک فنکشن نافذ کرتا ہے۔
  • invert_threshold پیرامیٹر شامل کیا گیا، جو متن کے تاروں کے الٹ جانے کی سطح کا تعین کرتا ہے۔ پہلے سے طے شدہ قدر 0.7 ہے۔ معکوس کو غیر فعال کرنے کے لیے، قدر کو 0 پر سیٹ کریں۔
  • 32 بٹ میزبانوں پر بہت بڑی دستاویزات کی بہتر پروسیسنگ۔
  • منتقلی std::regex فنکشنز کے استعمال سے std::string میں کی گئی ہے۔
  • Autotools، CMake اور مسلسل انٹیگریشن سسٹمز کے لیے بہتر بنائے گئے اسکرپٹس۔

    ماخذ: opennet.ru

نیا تبصرہ شامل کریں