ٽيڪسٽ ريڪگنيشن سسٽم جو رليز Tesseract 5.2

Tesseract 5.2 آپٽيڪل ٽيڪسٽ ريڪگنيشن سسٽم جو رليز شايع ڪيو ويو آهي، 8 کان وڌيڪ ٻولين ۾ UTF-100 اکرن ۽ متن جي سڃاڻپ جي حمايت ڪندي، بشمول روسي، قازق، بيلاروسي ۽ يوڪريني. نتيجو سادي متن ۾ يا HTML (hOCR)، ALTO (XML)، PDF ۽ TSV فارميٽ ۾ محفوظ ڪري سگھجي ٿو. سسٽم اصل ۾ 1985-1995 ۾ Hewlett Packard ليبارٽري ۾ ٺاهيو ويو؛ 2005 ۾، ڪوڊ اپاچي لائسنس تحت کوليو ويو ۽ گوگل ملازمن جي شموليت سان اڳتي وڌايو ويو. پروجيڪٽ جو سورس ڪوڊ Apache 2.0 لائسنس تحت ورهايو ويو آهي.

Tesseract ۾ هڪ ڪنسول يوٽيلٽي ۽ libtesseract لائبريري شامل آهي او سي آر ڪارڪردگي کي ٻين ايپليڪيشنن ۾ شامل ڪرڻ لاءِ. ٽئين پارٽي جي GUI انٽرفيس جيڪي Tesseract کي سپورٽ ڪن ٿا شامل آهن gImageReader، VietOCR ۽ YAGF. ٻه شناختي انجڻ پيش ڪيا ويا آهن: هڪ کلاسک جيڪو انفرادي ڪردار جي نمونن جي سطح تي متن کي سڃاڻي ٿو، ۽ هڪ نئون هڪ مشين لرننگ سسٽم جي استعمال جي بنياد تي LSTM بار بار نيورل نيٽ ورڪ جي بنياد تي، سڀني تارن کي سڃاڻڻ جي لاءِ بهتر ڪيو ويو آهي ۽ هڪ لاءِ اجازت ڏئي ٿو. درستگي ۾ اهم واڌارو. تيار ڪيل تربيتي ماڊل 123 ٻولين لاءِ شايع ڪيا ويا آهن. ڪارڪردگي کي بهتر ڪرڻ لاء، OpenMP ۽ SIMD هدايتون استعمال ڪندي ماڊلز AVX2، AVX، AVX512F، NEON يا SSE4.1 پيش ڪيا ويا آهن.

Tesseract 5.2 ۾ اهم سڌارا:

  • Intel AVX512F هدايتون استعمال ڪندي شامل ڪيل اصلاحون لاڳو ڪيون ويون.
  • C API ميموري مان مشين لرننگ ماڊل لوڊ ڪرڻ سان tesseract کي شروع ڪرڻ لاءِ هڪ فنڪشن لاڳو ڪري ٿو.
  • invert_threshold پيٽرول شامل ڪيو ويو، جيڪو متن جي تارن جي ڦيرڦار جي سطح کي طئي ڪري ٿو. ڊفالٽ قدر 0.7 آهي. انوشن کي غير فعال ڪرڻ لاء، قيمت مقرر ڪريو 0.
  • 32-bit ميزبان تي تمام وڏي دستاويزن جي پروسيسنگ کي بهتر بڻايو ويو.
  • منتقلي std::regex فنڪشن استعمال ڪندي std::string ۾ ڪئي وئي آهي.
  • Autotools، CMake ۽ مسلسل انٽيگريشن سسٽم لاءِ بهتر تعمير اسڪرپٽ.

    جو ذريعو: opennet.ru

تبصرو شامل ڪريو