Tesseract мәтінді тану жүйесінің шығарылымы 4.1

Дайындалды мәтінді тану оптикалық жүйесін шығару Tesseract 4.1, 8-ден астам тілде, соның ішінде орыс, қазақ, белорус және украин тілдеріндегі UTF-100 таңбалары мен мәтіндерін тануға қолдау көрсетеді. Нәтижені қарапайым мәтінде немесе HTML (hOCR), ALTO (XML), PDF және TSV пішімінде сақтауға болады. Жүйе бастапқыда 1985-1995 жылдары Hewlett Packard зертханасында жасалды, 2005 жылы код Apache лицензиясы бойынша ашылды және одан әрі Google қызметкерлерінің қатысуымен әзірленді. Жоба көздері кеңейтіңіз Apache 2.0 бойынша лицензияланған.

Tesseract консольдық қызметтік бағдарламасын және OCR функционалдығын басқа қолданбаларға ендіруге арналған libtesseract кітапханасын қамтиды. Tesseract қолдайтын үшінші тараптардан GUI интерфейстері атап өтуге болады gImageReader, VietOCR и YAGF. Екі тану қозғалтқышы ұсынылады: мәтінді жеке таңба үлгілері деңгейінде танитын классикалық және бүкіл жолдарды тану үшін оңтайландырылған және LSTM қайталанатын нейрондық желіге негізделген машиналық оқыту жүйесін пайдалануға негізделген жаңасы. дәлдіктің айтарлықтай артуы. Дайын дайындалған модельдер үшін жарияланады 123 тіл. Өнімділікті оңтайландыру үшін OpenMP және AVX2, AVX немесе SSE4.1 SIMD нұсқауларын қолданатын модульдер ұсынылады.

басты жақсартулар Tesseract 4.1-де:

  • XML пішімінде шығару мүмкіндігі қосылды АЛТО (Талдалған макет және мәтін нысаны). Бұл пішімді пайдалану үшін қолданбаны “tessaract image_name alto output_dir” ретінде іске қосу керек;
  • Қозғалтқышты оқытуды жеңілдететін LSTMBox және WordStrBox көрсетудің жаңа модульдері қосылды;
  • hOCR (HTML) шығысындағы псевдографияға қолдау қосылды;
  • Машиналық оқыту негізінде қозғалтқышты үйрету үшін Python тілінде жазылған балама сценарийлер қосылды;
  • AVX, AVX2 және SSE нұсқаулары арқылы кеңейтілген оңтайландырулар;
  • OpenMP қолдауы әдепкі бойынша өшірілген проблемалар өнімділігімен;
  • LSTM қозғалтқышындағы ақ және қара тізімдерге қолдау қосылды;
  • Cmake негізінде жақсартылған құрастыру сценарийлері.

Ақпарат көзі: opennet.ru

пікір қалдыру