టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ యొక్క విడుదల Tesseract 5.1

Tesseract 5.1 ఆప్టికల్ టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ విడుదల ప్రచురించబడింది, రష్యన్, కజఖ్, బెలారసియన్ మరియు ఉక్రేనియన్‌లతో సహా 8 కంటే ఎక్కువ భాషల్లో UTF-100 అక్షరాలు మరియు టెక్స్ట్‌ల గుర్తింపుకు మద్దతు ఇస్తుంది. ఫలితాన్ని సాదా వచనంలో లేదా HTML (hOCR), ALTO (XML), PDF మరియు TSV ఫార్మాట్‌లలో సేవ్ చేయవచ్చు. ఈ వ్యవస్థ వాస్తవానికి 1985-1995లో హ్యూలెట్ ప్యాకర్డ్ ప్రయోగశాలలో సృష్టించబడింది; 2005లో, ఈ కోడ్ అపాచీ లైసెన్స్ క్రింద తెరవబడింది మరియు Google ఉద్యోగుల భాగస్వామ్యంతో మరింత అభివృద్ధి చేయబడింది. ప్రాజెక్ట్ యొక్క సోర్స్ కోడ్ Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడింది.

Tesseract ఇతర అప్లికేషన్‌లలో OCR కార్యాచరణను పొందుపరచడానికి కన్సోల్ యుటిలిటీ మరియు libtesseract లైబ్రరీని కలిగి ఉంటుంది. టెస్సెరాక్ట్‌కు మద్దతు ఇచ్చే థర్డ్-పార్టీ GUI ఇంటర్‌ఫేస్‌లలో gImageReader, VietOCR మరియు YAGF ఉన్నాయి. రెండు రికగ్నిషన్ ఇంజన్‌లు అందించబడ్డాయి: వ్యక్తిగత అక్షర నమూనాల స్థాయిలో వచనాన్ని గుర్తించే క్లాసిక్ ఒకటి మరియు LSTM పునరావృత న్యూరల్ నెట్‌వర్క్ ఆధారంగా మెషీన్ లెర్నింగ్ సిస్టమ్ యొక్క ఉపయోగం ఆధారంగా కొత్తది, మొత్తం స్ట్రింగ్‌లను గుర్తించడానికి మరియు అనుమతించడానికి అనుకూలీకరించబడింది. ఖచ్చితత్వంలో గణనీయమైన పెరుగుదల. 123 భాషల కోసం రెడీమేడ్ శిక్షణ పొందిన నమూనాలు ప్రచురించబడ్డాయి. పనితీరును ఆప్టిమైజ్ చేయడానికి, OpenMP మరియు SIMD సూచనలను ఉపయోగించి మాడ్యూల్స్ AVX2, AVX, NEON లేదా SSE4.1 అందించబడతాయి.

Tesseract 5.1లో ప్రధాన మెరుగుదలలు:

  • Реализована возможность обработки областей с изображениями и линиями при выводе в форматах ALTO, hOCR и text.
  • Добавлен новый параметр curl_timeout lkz curl_easy_setop.
  • మెరుగైన నిర్మాణ వ్యవస్థ.
  • Проведена работа по удалению неиспользуемого кода
  • Устранены сбои, вызванные некорректной обработкой нулевых указателей в классе PageIterator::Orientation.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి