ٹیکسٹ ریکگنیشن سسٹم ٹیسریکٹ 5.1 کی ریلیز

Tesseract 5.1 آپٹیکل ٹیکسٹ ریکگنیشن سسٹم کا اجراء شائع کیا گیا ہے، جو روسی، قازق، بیلاروسی اور یوکرینی سمیت 8 سے زائد زبانوں میں UTF-100 حروف اور متن کی شناخت میں معاون ہے۔ نتیجہ سادہ متن میں یا HTML (hOCR)، ALTO (XML)، PDF اور TSV فارمیٹس میں محفوظ کیا جا سکتا ہے۔ یہ نظام اصل میں 1985-1995 میں ہیولٹ پیکارڈ لیبارٹری میں بنایا گیا تھا؛ 2005 میں، کوڈ کو اپاچی لائسنس کے تحت کھولا گیا تھا اور اسے گوگل کے ملازمین کی شرکت سے مزید تیار کیا گیا تھا۔ پروجیکٹ کا سورس کوڈ اپاچی 2.0 لائسنس کے تحت تقسیم کیا گیا ہے۔

Tesseract میں دیگر ایپلی کیشنز میں OCR فعالیت کو سرایت کرنے کے لیے کنسول یوٹیلیٹی اور libtesseract لائبریری شامل ہے۔ تھرڈ پارٹی GUI انٹرفیس جو Tesseract کو سپورٹ کرتے ہیں ان میں gImageReader، VietOCR اور YAGF شامل ہیں۔ دو شناختی انجن پیش کیے جاتے ہیں: ایک کلاسک جو انفرادی کریکٹر پیٹرن کی سطح پر متن کو پہچانتا ہے، اور ایک نیا LSTM ریکرنٹ نیورل نیٹ ورک پر مبنی مشین لرننگ سسٹم کے استعمال پر مبنی ہے، جو پوری تاروں کو پہچاننے کے لیے موزوں ہے اور اس کی اجازت دیتا ہے۔ درستگی میں نمایاں اضافہ۔ 123 زبانوں کے لیے تیار شدہ تربیت یافتہ ماڈل شائع کیے گئے ہیں۔ کارکردگی کو بہتر بنانے کے لیے، OpenMP اور SIMD ہدایات AVX2، AVX، NEON یا SSE4.1 استعمال کرنے والے ماڈیولز پیش کیے جاتے ہیں۔

Tesseract 5.1 میں اہم بہتری:

  • ALTO، hOCR اور ٹیکسٹ فارمیٹس میں آؤٹ پٹ کرتے وقت تصاویر اور لائنوں کے ساتھ علاقوں پر کارروائی کرنے کی صلاحیت کو لاگو کیا گیا ہے۔
  • نیا پیرامیٹر curl_timeout lkz curl_easy_setop شامل کیا گیا۔
  • بہتر تعمیراتی نظام۔
  • غیر استعمال شدہ کوڈ کو ہٹانے کے لیے کام کیا گیا ہے۔
  • PageIterator::Orientation کلاس میں null پوائنٹرز کی غلط ہینڈلنگ کی وجہ سے طے شدہ کریشز۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں