Ntọhapụ nke sistemụ njirimara ederede Tesseract 5.0

Ebipụtala ntọhapụ nke Tesseract 4.1 optical text recognition system, na-akwado nnabata nke mkpụrụedemede UTF-8 na ederede n'ihe karịrị asụsụ 100, gụnyere Russian, Kazakh, Belarusian na Ukrainian. Enwere ike ịchekwa nsonaazụ ya na ederede doro anya ma ọ bụ na HTML (hOCR), ALTO (XML), PDF na TSV. Emebere usoro a na 1985-1995 na ụlọ nyocha Hewlett Packard; na 2005, emepere koodu ahụ n'okpuru ikike Apache wee mepụta ya na ntinye aka nke ndị ọrụ Google. A na-ekesa koodu isi mmalite nke ọrụ ahụ n'okpuru ikike Apache 2.0.

Tesseract gụnyere akụrụngwa njikwa yana ọba akwụkwọ libteseract maka itinye ọrụ OCR n'ime ngwa ndị ọzọ. Ndị GUI ndị ọzọ na-akwado Tesseract gụnyere gImageReader, VietOCR na YAGF. A na-enye engines ude abụọ: nke kpochapụrụ nke na-amata ederede n'ogo nke ụkpụrụ omume onye ọ bụla, na nke ọhụrụ dabere na iji usoro mmụta igwe dabere na netwọkụ akwara ozi LSTM na-emegharị ugboro ugboro, nke kachasị maka ịmata ụdọ niile na ikwe ka a. mmụba dị ịrịba ama na izi ezi. E bipụtala ụdị a zụrụ azụ maka asụsụ 123. Iji kwalite arụmọrụ, a na-enye modul na-eji ntụziaka OpenMP na SIMD AVX2, AVX, NEON ma ọ bụ SSE4.1.

Nnukwu nkwalite na Tesseract 5.0:

  • Значительное изменение номера версии связано с внесением в API изменений, нарушающих совместимость. В частности, публично доступный API libtesseract больше не привязан к проприетарным типам данных GenericVector и STRING, вместо которых в коде задействованы std::string и std::vector.
  • Проведена реорганизация дерева исходных текстов. Публичные заголовочные файлы перемещены в каталог include/tesseract.
  • Переработано управление памятью, все вызовы malloc и free заменены на код C++. Проведена общая модернизация кода.
  • Добавлены оптимизации для архитектур ARM и ARM64, для ускорения вычислений задействованы инструкции ARM NEON. Проведена общая для всех архитектур оптимизация производительности.
  • Реализованы новые режимы тренировки моделей и распознавания текста, основанные на использовании вычислений с плавающей запятой. Новые режимы отличаются более высокой производительностью и снижением потребления памяти. В движке LSTM быстрый режим float32 включён по умолчанию.
  • Осуществлён переход на использование нормализации Unicode с использованием формы NFC (Normalization Form Canonical).
  • Добавлена опция для настройки детализации логов (—loglevel).
  • Переработана система сборки на основе Autotools, которая переведена на сборку в нерекурсивном режиме.
  • Ветка «master» в Git переименована в «main».
  • Добавлена поддержка новых выпусков macOS и систем Apple на базе чипа M1.

    isi: opennet.ru

Tinye a comment