ٽيڪسٽ ريڪگنيشن سسٽم جو رليز Tesseract 4.1

تيار ڪيل آپٽيڪل ٽيڪسٽ ريڪگنيشن سسٽم جو خلاصو ٽيسرڪٽ 4.18 کان وڌيڪ ٻولين ۾ UTF-100 اکرن ۽ متن جي سڃاڻپ جي حمايت ڪندي، بشمول روسي، قازق، بيلاروسي ۽ يوڪريني. نتيجو سادي متن ۾ يا HTML (hOCR)، ALTO (XML)، PDF ۽ TSV فارميٽ ۾ محفوظ ڪري سگھجي ٿو. سسٽم اصل ۾ 1985-1995 ۾ Hewlett Packard ليبارٽري ۾ ٺاهيو ويو؛ 2005 ۾، ڪوڊ اپاچي لائسنس تحت کوليو ويو ۽ گوگل ملازمن جي شموليت سان اڳتي وڌايو ويو. پروجيڪٽ ذريعن ڦهلڻ Apache 2.0 تحت لائسنس يافته.

Tesseract ۾ هڪ ڪنسول يوٽيلٽي ۽ libtesseract لائبريري شامل آهي او سي آر ڪارڪردگي کي ٻين ايپليڪيشنن ۾ شامل ڪرڻ لاءِ. ٽئين پارٽين کان جيڪي حمايت ڪن ٿيون Tesseract GUI انٽرفيس توهان نوٽ ڪري سگهو ٿا امتياز ڪندڙ, VietOCR и YAGF. ٻه شناختي انجڻ پيش ڪيا ويا آهن: هڪ کلاسک جيڪو انفرادي ڪردار جي نمونن جي سطح تي متن کي سڃاڻي ٿو، ۽ هڪ نئون هڪ مشين لرننگ سسٽم جي استعمال جي بنياد تي LSTM بار بار نيورل نيٽ ورڪ جي بنياد تي، سڀني تارن کي سڃاڻڻ جي لاءِ بهتر ڪيو ويو آهي ۽ هڪ لاءِ اجازت ڏئي ٿو. درستگي ۾ اهم واڌارو. تيار ٿيل تربيتي ماڊل لاء شايع ٿيل آهن 123 ٻوليون. ڪارڪردگي کي بهتر ڪرڻ لاء، ماڊل استعمال ڪندي OpenMP ۽ AVX2، AVX يا SSE4.1 SIMD هدايتون پيش ڪيون ويون آهن.

مکيه سڌارا Tesseract 4.1 ۾:

  • ايڪس ايم ايل فارميٽ ۾ آئوٽ ڪرڻ جي صلاحيت شامل ڪئي وئي ALTO (تجزيي لي آئوٽ ۽ ٽيڪسٽ اعتراض). ھن فارميٽ کي استعمال ڪرڻ لاء، توھان کي ايپليڪيشن کي هلائڻ گھرجي "tessaract image_name alto output_dir"؛
  • شامل ڪيو ويو نئون رينڊرنگ ماڊل LSTMBox ۽ WordStrBox، انجڻ جي تربيت کي آسان ڪرڻ؛
  • hOCR (HTML) آئوٽ ۾ pseudographics لاءِ سپورٽ شامل ڪئي وئي؛
  • مشين لرننگ جي بنياد تي انجڻ جي تربيت لاءِ پٿون ۾ لکيل متبادل لکتون شامل ڪيون ويون.
  • AVX، AVX2 ۽ SSE هدايتون استعمال ڪندي وڌايل اصلاحون؛
  • OpenMP سپورٽ ڊفالٽ جي ڪري بند ٿيل آهي مسئلا پيداوار سان؛
  • LSTM انجڻ ۾ اڇي ۽ ڪاري لسٽن لاءِ سپورٽ شامل ڪئي وئي؛
  • Cmake جي بنياد تي بهتر تعمير اسڪرپٽ.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو