ٹیکسٹ ریکگنیشن سسٹم ٹیسریکٹ 5.0 کی ریلیز

Tesseract 4.1 آپٹیکل ٹیکسٹ ریکگنیشن سسٹم کا اجراء شائع کیا گیا ہے، جو روسی، قازق، بیلاروسی اور یوکرینی سمیت 8 سے زائد زبانوں میں UTF-100 حروف اور متن کی شناخت میں معاون ہے۔ نتیجہ سادہ متن میں یا HTML (hOCR)، ALTO (XML)، PDF اور TSV فارمیٹس میں محفوظ کیا جا سکتا ہے۔ یہ نظام اصل میں 1985-1995 میں ہیولٹ پیکارڈ لیبارٹری میں بنایا گیا تھا؛ 2005 میں، کوڈ کو اپاچی لائسنس کے تحت کھولا گیا تھا اور اسے گوگل کے ملازمین کی شرکت سے مزید تیار کیا گیا تھا۔ پروجیکٹ کا سورس کوڈ اپاچی 2.0 لائسنس کے تحت تقسیم کیا گیا ہے۔

Tesseract میں دیگر ایپلی کیشنز میں OCR فعالیت کو سرایت کرنے کے لیے کنسول یوٹیلیٹی اور libtesseract لائبریری شامل ہے۔ تھرڈ پارٹی GUI انٹرفیس جو Tesseract کو سپورٹ کرتے ہیں ان میں gImageReader، VietOCR اور YAGF شامل ہیں۔ دو شناختی انجن پیش کیے جاتے ہیں: ایک کلاسک جو انفرادی کریکٹر پیٹرن کی سطح پر متن کو پہچانتا ہے، اور ایک نیا LSTM ریکرنٹ نیورل نیٹ ورک پر مبنی مشین لرننگ سسٹم کے استعمال پر مبنی ہے، جو پوری تاروں کو پہچاننے کے لیے موزوں ہے اور اس کی اجازت دیتا ہے۔ درستگی میں نمایاں اضافہ۔ 123 زبانوں کے لیے تیار شدہ تربیت یافتہ ماڈل شائع کیے گئے ہیں۔ کارکردگی کو بہتر بنانے کے لیے، OpenMP اور SIMD ہدایات AVX2، AVX، NEON یا SSE4.1 استعمال کرنے والے ماڈیولز پیش کیے جاتے ہیں۔

Tesseract 5.0 میں اہم بہتری:

  • Значительное изменение номера версии связано с внесением в API изменений, нарушающих совместимость. В частности, публично доступный API libtesseract больше не привязан к проприетарным типам данных GenericVector и STRING, вместо которых в коде задействованы std::string и std::vector.
  • Проведена реорганизация дерева исходных текстов. Публичные заголовочные файлы перемещены в каталог include/tesseract.
  • Переработано управление памятью, все вызовы malloc и free заменены на код C++. Проведена общая модернизация кода.
  • Добавлены оптимизации для архитектур ARM и ARM64, для ускорения вычислений задействованы инструкции ARM NEON. Проведена общая для всех архитектур оптимизация производительности.
  • Реализованы новые режимы тренировки моделей и распознавания текста, основанные на использовании вычислений с плавающей запятой. Новые режимы отличаются более высокой производительностью и снижением потребления памяти. В движке LSTM быстрый режим float32 включён по умолчанию.
  • Осуществлён переход на использование нормализации Unicode с использованием формы NFC (Normalization Form Canonical).
  • Добавлена опция для настройки детализации логов (—loglevel).
  • Переработана система сборки на основе Autotools, которая переведена на сборку в нерекурсивном режиме.
  • Ветка «master» в Git переименована в «main».
  • Добавлена поддержка новых выпусков macOS и систем Apple на базе чипа M1.

    ماخذ: opennet.ru

نیا تبصرہ شامل کریں