Нашри системаи шинохти матн Tesseract 5.0

Нашри системаи шинохти матни оптикии Tesseract 4.1 нашр шуд, ки эътирофи аломатҳои UTF-8 ва матнҳоро дар зиёда аз 100 забон, аз ҷумла русӣ, қазоқӣ, белорусӣ ва украинӣ дастгирӣ мекунад. Натиҷаро метавон дар матни оддӣ ё дар форматҳои HTML (hOCR), ALTO (XML), PDF ва TSV захира кард. Система дар ибтидо дар солҳои 1985-1995 дар лабораторияи Hewlett Packard сохта шуда буд, соли 2005 код зери иҷозатномаи Apache кушода шуд ва минбаъд бо иштироки кормандони Google таҳия карда шуд. Рамзи сарчашмаи лоиҳа таҳти иҷозатномаи Apache 2.0 паҳн карда мешавад.

Tesseract як утилитаи консол ва китобхонаи libtesseract-ро барои ворид кардани функсияҳои OCR ба барномаҳои дигар дар бар мегирад. Интерфейсҳои GUI-и тарафи сеюм, ки Tesseract-ро дастгирӣ мекунанд, gImageReader, VietOCR ва YAGF мебошанд. Ду муҳаррики шинохт пешниҳод карда мешаванд: муҳаррики классикӣ, ки матнро дар сатҳи намунаҳои аломатҳои инфиродӣ эътироф мекунад ва муҳаррики нав дар асоси истифодаи системаи омӯзиши мошинсозӣ дар асоси шабакаи нейронҳои такрории LSTM, ки барои шинохти тамоми сатрҳо оптимизатсия шудааст ва имкон медиҳад ба таври назаррас афзудани дақиқӣ. Моделҳои омӯзонидашуда барои 123 забон нашр шудаанд. Барои оптимизатсияи кор, модулҳо бо истифода аз дастурҳои OpenMP ва SIMD AVX2, AVX, NEON ё SSE4.1 пешниҳод карда мешаванд.

Пешрафтҳои асосӣ дар Tesseract 5.0:

  • Тағйироти назаррас дар рақами версия бо сабаби тағирот дар API, ки мутобиқатро вайрон мекунанд. Махсусан, API-и дастраси оммавӣ libtesseract дигар ба намуди маълумоти хусусии GenericVector ва STRING, ба манфиати std::string ва std::vector вобаста нест.
  • Дарахти матни сарчашма аз нав ташкил карда шуд. Файлҳои сарлавҳаи умумӣ ба директорияи дохил/tesseract интиқол дода шуданд.
  • Идоракунии хотира аз нав тарҳрезӣ шуд, ҳама зангҳои malloc ва ройгон бо рамзи C++ иваз карда шуданд. Модернизациям умумии кодекс ба амал бароварда шуд.
  • Барои меъмории ARM ва ARM64 оптимизатсияи иловашуда; Дастурҳои ARM NEON барои суръат бахшидан ба ҳисобҳо истифода мешаванд. Оптимизатсияи иҷроиш, ки барои ҳама меъморӣ маъмул аст, анҷом дода шудааст.
  • Усулҳои нави омӯзиши моделҳо ва шинохти матн дар асоси истифодаи ҳисобҳои нуқтаи шинокунанда ҷорӣ карда шуданд. Усулҳои нав иҷрои баландтар ва истеъмоли камтари хотираро пешниҳод мекунанд. Дар муҳаррики LSTM, ҳолати фаврии float32 бо нобаёнӣ фаъол аст.
  • Гузариш ба истифодаи нормализатсияи Юникод бо истифода аз шакли NFC (Normalization Form Canonical) анҷом дода шуд.
  • Имконият барои танзими тафсилоти гузориш (--loglevel) илова карда шуд.
  • Системаи сохтан дар асоси Autotools аз нав тарҳрезӣ карда шуд ва ба сохтан дар ҳолати рекурсивӣ гузашт.
  • Филиали "усто" дар Гит ба "асосӣ" иваз карда шуд.
  • Дастгирии иловашуда барои версияҳои нави macOS ва системаҳои Apple дар асоси чипи M1.

    Манбаъ: opennet.ru

Илова Эзоҳ