Te whakaputanga o te punaha tohu tuhinga Tesseract 5.0

Ko te tukunga o te Tesseract 4.1 pūnaha whakamohiotanga kuputuhi whatu kua whakaputaina, e tautoko ana i te mohiotanga o nga tohu UTF-8 me nga tuhinga i roto i nga reo 100 neke atu, tae atu ki te Russian, Kazakh, Belarusian me Ukrainian. Ko te hua ka taea te penapena ki roto i nga tuhinga noa, ki te HTML (hOCR), ALTO (XML), PDF me nga whakatakotoranga TSV. I hangaia te punaha i te tau 1985-1995 i te taiwhanga o Hewlett Packard; i te tau 2005, i whakatuwherahia te waehere i raro i te raihana Apache, a, i whakawhanakehia ano me te whai waahi o nga kaimahi a Google. Ko te waehere puna o te kaupapa ka tohatohahia i raro i te raihana Apache 2.0.

Kei a Tesseract he taputapu papatohu me te whare pukapuka libtesseract hei whakauru i te mahi OCR ki etahi atu tono. Ko nga atanga GUI tuatoru e tautoko ana i a Tesseract ko gImageReader, VietOCR me YAGF. E rua nga miihini whakamohiotanga e tukuna ana: he mea matarohia e mohio ana ki nga tuhinga i te taumata o nga tauira ahua takitahi, me tetahi mea hou i runga i te whakamahinga o te punaha ako miihini i runga i te whatunga neural LSTM, kua arotauhia mo te mohio ki nga aho katoa me te tuku mo te nui te pikinga o te tika. Kua taia nga tauira kua oti te whakangungu mo nga reo 123. Hei arotau i nga mahi, ka tukuna nga waahanga ma te whakamahi i nga tohutohu OpenMP me SIMD AVX2, AVX, NEON, SSE4.1 ranei.

Nga whakapainga nui i Tesseract 5.0:

  • Значительное изменение номера версии связано с внесением в API изменений, нарушающих совместимость. В частности, публично доступный API libtesseract больше не привязан к проприетарным типам данных GenericVector и STRING, вместо которых в коде задействованы std::string и std::vector.
  • Проведена реорганизация дерева исходных текстов. Публичные заголовочные файлы перемещены в каталог include/tesseract.
  • Переработано управление памятью, все вызовы malloc и free заменены на код C++. Проведена общая модернизация кода.
  • Добавлены оптимизации для архитектур ARM и ARM64, для ускорения вычислений задействованы инструкции ARM NEON. Проведена общая для всех архитектур оптимизация производительности.
  • Реализованы новые режимы тренировки моделей и распознавания текста, основанные на использовании вычислений с плавающей запятой. Новые режимы отличаются более высокой производительностью и снижением потребления памяти. В движке LSTM быстрый режим float32 включён по умолчанию.
  • Осуществлён переход на использование нормализации Unicode с использованием формы NFC (Normalization Form Canonical).
  • Добавлена опция для настройки детализации логов (—loglevel).
  • Переработана система сборки на основе Autotools, которая переведена на сборку в нерекурсивном режиме.
  • Ветка «master» в Git переименована в «main».
  • Добавлена поддержка новых выпусков macOS и систем Apple на базе чипа M1.

    Source: opennet.ru

Tāpiri i te kōrero