የጽሑፍ ማወቂያ ስርዓት መለቀቅ Tesseract 4.1

ተዘጋጅቷል። የኦፕቲካል ጽሑፍ ማወቂያ ስርዓት መለቀቅ Tesseract 4.1ሩሲያኛ፣ ካዛክኛ፣ ቤላሩስኛ እና ዩክሬንኛን ጨምሮ ከ8 በላይ በሆኑ ቋንቋዎች የUTF-100 ቁምፊዎችን እና ጽሑፎችን ማወቂያን ይደግፋል። ውጤቱም በቀላል ጽሁፍ ወይም በኤችቲኤምኤል (hOCR)፣ ALTO (XML)፣ ፒዲኤፍ እና TSV ቅርጸቶች ሊቀመጥ ይችላል። ስርዓቱ መጀመሪያ የተፈጠረው በ1985-1995 በሄውሌት ፓካርድ ላብራቶሪ ውስጥ ነበር፤ በ2005 ኮዱ በአፓቼ ፍቃድ ተከፍቶ በጎግል ሰራተኞች ተሳትፎ የበለጠ ተዳበረ። የፕሮጀክት ምንጮች ስርጭት በ Apache 2.0 ፍቃድ የተሰጠው.

Tesseract የኮንሶል መገልገያ እና የlibtesseract ቤተ-መጽሐፍትን የ OCR ተግባርን ወደ ሌሎች መተግበሪያዎች ለመክተት ያካትታል። Tesseractን ከሚደግፉ ሶስተኛ ወገኖች GUI በይነገጾች የሚለውን ልታስተውል ትችላለህ gImageReader።, ቪየትኦሲአር и YAGF. ሁለት የማወቂያ ሞተሮች ቀርበዋል፡ ጽሑፍን በግል የገጸ-ባህሪያት ደረጃ የሚያውቅ ክላሲክ እና አዲስ በ LSTM ተደጋጋሚ የነርቭ አውታረመረብ ላይ የተመሰረተ የማሽን መማሪያ ስርዓትን በመጠቀም አጠቃላይ ገመዶችን ለመለየት እና ለመፍቀድ የተሻሻለ ከፍተኛ ትክክለኛነት መጨመር. ዝግጁ የሆኑ የሰለጠኑ ሞዴሎች ታትመዋል 123 ቋንቋዎች. አፈጻጸምን ለማመቻቸት OpenMP እና AVX2, AVX ወይም SSE4.1 SIMD መመሪያዎችን የሚጠቀሙ ሞጁሎች ቀርበዋል.

ዋና ማሻሻያዎች በTesseract 4.1 ውስጥ፡-

  • በኤክስኤምኤል ቅርጸት የማውጣት ችሎታ ታክሏል። ከፍተኛ (የተተነተነ አቀማመጥ እና የጽሑፍ ነገር). ይህን ቅርጸት ለመጠቀም መተግበሪያውን እንደ "tessaract image_name alto output_dir" ማስኬድ አለብዎት;
  • አዲስ የማሳያ ሞጁሎች LSTMBox እና WordStrBox ታክለዋል፣ የሞተር ማሰልጠኛን ቀላል ማድረግ፣
  • በ hOCR (ኤችቲኤምኤል) ውፅዓት ውስጥ ለ pseudographics ድጋፍ ታክሏል;
  • በማሽን መማር ላይ ተመስርቶ ሞተሩን ለማሰልጠን በፓይዘን የተፃፉ ተለዋጭ ፅሁፎች;
  • AVX, AVX2 እና SSE መመሪያዎችን በመጠቀም የተስፋፋ ማመቻቸት;
  • የOpenMP ድጋፍ በነባሪነት ተሰናክሏል። ችግሮች ከምርታማነት ጋር;
  • በ LSTM ሞተር ውስጥ ለነጭ እና ጥቁር ዝርዝሮች ተጨማሪ ድጋፍ;
  • በCmake ላይ የተመሰረቱ የተሻሻሉ የግንባታ ስክሪፕቶች።

ምንጭ: opennet.ru

አስተያየት ያክሉ