เบ›เปˆเบญเบ Tesseract 4.1 เบฅเบฐเบšเบปเบšเบเบฒเบ™เบฎเบฑเบšเบฎเบนเป‰เบ‚เปเป‰เบ„เบงเบฒเบก

เบเบฐเบเบฝเบก เบเบฒเบ™เบ›เปˆเบญเบเบฅเบฐเบšเบปเบšเบเบฒเบ™เบฎเบฑเบšเบฎเบนเป‰เบ‚เปเป‰เบ„เบงเบฒเบก optical Tesseract 4.1, เบชเบฐโ€‹เบซเบ™เบฑเบšโ€‹เบชเบฐโ€‹เบซเบ™เบนเบ™โ€‹เบเบฒเบ™โ€‹เบฎเบฑเบšโ€‹เบฎเบนเป‰โ€‹เบ‚เบญเบ‡ UTFโ€‹-8 เบฅเบฑเบโ€‹เบชเบฐโ€‹เบ™เบฐโ€‹เปเบฅเบฐโ€‹เบšเบปเบ”โ€‹เป€เบฅเบทเปˆเบญเบ‡โ€‹เปƒเบ™โ€‹เบซเบผเบฒเบโ€‹เบโ€‹เปˆโ€‹เบงเบฒ 100 เบžเบฒโ€‹เบชเบฒโ€‹, เบฅเบงเบกโ€‹เบ—เบฑเบ‡โ€‹เบฅเบฑเบ”โ€‹เป€เบŠเบโ€‹, Kazakhโ€‹, เป€เบšโ€‹เบฅเบฒโ€‹เบฅเบธเบ”โ€‹เบŠเบตโ€‹เปเบฅเบฐโ€‹เบญเบนโ€‹เปเบเบฃเบ™โ€‹. เบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบชเบฒเบกเบฒเบ”เบ–เบทเบเบšเบฑเบ™เบ—เบถเบเป„เบงเป‰เปƒเบ™เบ‚เปเป‰เบ„เบงเบฒเบกเบ—เปเบฒเบกเบฐเบ”เบฒเบซเบผเบทเปƒเบ™เบฎเบนเบšเปเบšเบš HTML (hOCR), ALTO (XML), PDF เปเบฅเบฐ TSV. เบฅเบฐเบšเบปเบšเบ”เบฑเปˆเบ‡เบเปˆเบฒเบงเป„เบ”เป‰เบ–เบทเบเบชเป‰เบฒเบ‡เบ‚เบทเป‰เบ™เปƒเบ™เป€เบšเบทเป‰เบญเบ‡เบ•เบปเป‰เบ™เปƒเบ™เบ›เบต 1985-1995 เปƒเบ™เบซเป‰เบญเบ‡เบ—เบปเบ”เบฅเบญเบ‡ Hewlett Packard; เปเบซเบผเปˆเบ‡เป‚เบ„เบ‡เบเบฒเบ™ เปเบœเปˆโ€‹เบเบฐโ€‹เบˆเบฒเบโ€‹เป€เบŠเบทเป‰เบญ เบญเบฐเบ™เบธเบเบฒเบ”เบžเบฒเบเปƒเบ•เป‰ Apache 2.0.

Tesseract เบ›เบฐเบเบญเบšเบกเบตเบœเบปเบ™เบ›เบฐเป‚เบซเบเบ”เบ‚เบญเบ‡ console เปเบฅเบฐเบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” libtesseract เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบเบฑเบ‡เบŸเบฑเบ‡เบŠเบฑเบ™ OCR เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เปเบญเบฑเบšเบžเบฅเบดเป€เบ„เบŠเบฑเบ™เบญเบทเปˆเบ™เป†. เบˆเบฒเบเบžเบฒเบเบชเปˆเบงเบ™เบ—เบตเบชเบฒเบกเบ—เบตเปˆเบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™ Tesseract เบเบฒเบ™เป‚เบ•เป‰เบ•เบญเบš GUI เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบชเบฑเบ‡เป€เบเบ” gImageReader, VietOCR ะธ YAGF. เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบเบฒเบ™เบฎเบฑเบšเบฎเบนเป‰เบชเบญเบ‡เปเบกเปˆเบ™เป„เบ”เป‰เบ–เบทเบเบชเบฐเป€เบซเบ™เบต: เปเบšเบšเบ„เบฅเบฒเบชเบชเบดเบเบ—เบตเปˆเบฎเบฑเบšเบฎเบนเป‰เบ‚เปเป‰เบ„เบงเบฒเบกเปƒเบ™เบฅเบฐเบ”เบฑเบšเบ‚เบญเบ‡เบฎเบนเบšเปเบšเบšเบ•เบปเบงเบญเบฑเบเบชเบญเบ™เบชเปˆเบงเบ™เบšเบธเบเบ„เบปเบ™, เปเบฅเบฐเบญเบฑเบ™เปƒเบซเบกเปˆเป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆเบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบฅเบฐเบšเบปเบšเบเบฒเบ™เบฎเบฝเบ™เบฎเบนเป‰เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆเป€เบ„เบทเบญเบ‚เปˆเบฒเบ neural recurrent LSTM, เป€เบซเบกเบฒเบฐเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฎเบฑเบšเบฎเบนเป‰เบชเบฒเบเบ—เบฑเบ‡เบซเบกเบปเบ”เปเบฅเบฐเบญเบฐเบ™เบธเบเบฒเบ”เปƒเบซเป‰เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™. เป€เบžเบตเปˆเบกเบ‚เบถเป‰เบ™เบขเปˆเบฒเบ‡เบซเบผเบงเบ‡เบซเบผเบฒเบเปƒเบ™เบ„เบงเบฒเบกเบ–เบทเบเบ•เป‰เบญเบ‡. เปเบšเบšเบˆเปเบฒเบฅเบญเบ‡เบ—เบตเปˆเบชเปเบฒเป€เบฅเบฑเบ”เบเบฒเบ™เบเบถเบเบญเบปเบšเบฎเบปเบกเป„เบ”เป‰เบ–เบทเบเบˆเบฑเบ”เบžเบตเบกเบกเบฒเบชเปเบฒเบฅเบฑเบš 123 เบžเบฒเบชเบฒ. เป€เบžเบทเปˆเบญเป€เบžเบตเปˆเบกเบ›เบฐเบชเบดเบ”เบ•เบดเบžเบฒเบš, เป‚เบกเบ”เบนเบ™เบ—เบตเปˆเปƒเบŠเป‰ OpenMP เปเบฅเบฐ AVX2, AVX เบซเบผเบท SSE4.1 SIMD เปเบ™เบฐเบ™เปเบฒ.

เบ•เบปเป‰เบ™โ€‹เบ•เป เบเบฒเบ™เบ›เบฑเบšเบ›เบธเบ‡ เปƒเบ™ Tesseract 4.1:

  • เป€เบžเบตเปˆเบกเบ„เบงเบฒเบกเบชเบฒเบกเบฒเบ”เปƒเบ™เบเบฒเบ™เบญเบญเบเปƒเบ™เบฎเบนเบšเปเบšเบš XML ALTO (เบเบฒเบ™โ€‹เบงเบดโ€‹เป€เบ„เบฒเบฐโ€‹เป‚เบ„เบ‡โ€‹เบฎเปˆเบฒเบ‡โ€‹เปเบฅเบฐโ€‹เบงเบฑเบ”โ€‹เบ–เบธโ€‹เบ‚เปเป‰โ€‹เบ„เบงเบฒเบกโ€‹)โ€‹. เบเบฒเบ™โ€‹เบ™เปเบฒโ€‹เปƒเบŠเป‰โ€‹เบฎเบนเบšโ€‹เปเบšเบšโ€‹เบ™เบตเป‰โ€‹, เบ—เปˆเบฒเบ™โ€‹เบ„เบงเบ™โ€‹เบˆเบฐโ€‹เบ”เปเบฒโ€‹เป€เบ™เบตเบ™โ€‹เบเบฒเบ™โ€‹เบ„เปเบฒโ€‹เบฎเป‰เบญเบ‡โ€‹เบชเบฐโ€‹เบซเบกเบฑเบโ€‹เป€เบ›เบฑเบ™ "tessaract image_name alto output_dirโ€‹"โ€‹;
  • เป€เบžเบตเปˆเบกเป‚เบกเบ”เบนเบ™เบเบฒเบ™เบชเบฐเปเบ”เบ‡เบœเบปเบ™เปƒเบซเบกเปˆ LSTMBox เปเบฅเบฐ WordStrBox, เป€เบฎเบฑเบ”เปƒเบซเป‰เบเบฒเบ™เบเบถเบเบญเบปเบšเบฎเบปเบกเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเบ‡เปˆเบฒเบเบ‚เบถเป‰เบ™;
  • เป€เบžเบตเปˆเบกเบเบฒเบ™เบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™เบชเปเบฒเบฅเบฑเบš pseudographics เปƒเบ™ hOCR (HTML) เบœเบปเบ™เบœเบฐเบฅเบดเบ”;
  • เป€เบžเบตเปˆเบกเบชเบฐเบ„เบดเบšเบ—เบฒเบ‡เป€เบฅเบทเบญเบเบ—เบตเปˆเบ‚เบฝเบ™เปƒเบ™ Python เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบเบถเบเบญเบปเบšเบฎเบปเบกเป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบเป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆเบเบฒเบ™เบฎเบฝเบ™เบฎเบนเป‰เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ;
  • เบ‚เบฐเบซเบเบฒเบเบเบฒเบ™เป€เบžเบตเปˆเบกเบ›เบฐเบชเบดเบ”เบ—เบดเบžเบฒเบšเป‚เบ”เบเปƒเบŠเป‰เบ„เปเบฒเปเบ™เบฐเบ™เปเบฒ AVX, AVX2 เปเบฅเบฐ SSE;
  • เบเบฒเบ™เบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™ OpenMP เบ–เบทเบเบ›เบดเบ”เปƒเบŠเป‰เบ‡เบฒเบ™เป‚เบ”เบเบ„เปˆเบฒเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบ เบšเบฑเบ™เบซเบฒ เบเบฑเบšเบœเบปเบ™เบœเบฐเบฅเบดเบ”;
  • เป€เบžเบตเปˆเบกเบเบฒเบ™เบชเบฐเบซเบ™เบฑเบšเบชเบฐเบซเบ™เบนเบ™เบชเปเบฒเบฅเบฑเบšเบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบชเบตเบ‚เบฒเบงเปเบฅเบฐเบชเบตเบ”เปเบฒเปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เบˆเบฑเบ LSTM;
  • เบ›เบฑเบšเบ›เบธเบ‡เบเบฒเบ™เบชเป‰เบฒเบ‡เบชเบฐเบ„เบฃเบดเบšเป‚เบ”เบเบญเบตเบ‡เปƒเบชเปˆ Cmake.

เปเบซเบผเปˆเบ‡เบ‚เปเป‰เบกเบนเบ™: opennet.ru

เป€เบžเบตเปˆเบกเบ„เบงเบฒเบกเบ„เบดเบ”เป€เบซเบฑเบ™