టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ యొక్క విడుదల Tesseract 4.1

సిద్ధమైంది ఆప్టికల్ టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ విడుదల టెస్రాక్ట్ 4.1, రష్యన్, కజఖ్, బెలారసియన్ మరియు ఉక్రేనియన్‌తో సహా 8 కంటే ఎక్కువ భాషలలో UTF-100 అక్షరాలు మరియు టెక్స్ట్‌ల గుర్తింపుకు మద్దతు ఇస్తుంది. ఫలితాన్ని సాదా వచనంలో లేదా HTML (hOCR), ALTO (XML), PDF మరియు TSV ఫార్మాట్‌లలో సేవ్ చేయవచ్చు. ఈ వ్యవస్థ వాస్తవానికి 1985-1995లో హ్యూలెట్ ప్యాకర్డ్ ప్రయోగశాలలో సృష్టించబడింది; 2005లో, ఈ కోడ్ అపాచీ లైసెన్స్ క్రింద తెరవబడింది మరియు Google ఉద్యోగుల భాగస్వామ్యంతో మరింత అభివృద్ధి చేయబడింది. ప్రాజెక్ట్ మూలాలు వ్యాప్తి Apache 2.0 క్రింద లైసెన్స్ పొందింది.

Tesseract ఇతర అప్లికేషన్‌లలో OCR కార్యాచరణను పొందుపరచడానికి కన్సోల్ యుటిలిటీ మరియు libtesseract లైబ్రరీని కలిగి ఉంటుంది. టెసెరాక్ట్‌కు మద్దతు ఇచ్చే మూడవ పార్టీల నుండి GUI ఇంటర్‌ఫేస్‌లు మీరు గమనించగలరు gImageReader, VietOCR и YAGF. రెండు రికగ్నిషన్ ఇంజన్‌లు అందించబడ్డాయి: వ్యక్తిగత అక్షర నమూనాల స్థాయిలో వచనాన్ని గుర్తించే క్లాసిక్ ఒకటి మరియు LSTM పునరావృత న్యూరల్ నెట్‌వర్క్ ఆధారంగా మెషీన్ లెర్నింగ్ సిస్టమ్ యొక్క ఉపయోగం ఆధారంగా కొత్తది, మొత్తం స్ట్రింగ్‌లను గుర్తించడానికి మరియు అనుమతించడానికి అనుకూలీకరించబడింది. ఖచ్చితత్వంలో గణనీయమైన పెరుగుదల. కోసం రెడీమేడ్ శిక్షణ పొందిన నమూనాలు ప్రచురించబడ్డాయి 123 భాషలు. పనితీరును ఆప్టిమైజ్ చేయడానికి, OpenMP మరియు AVX2, AVX లేదా SSE4.1 SIMD సూచనలను ఉపయోగించి మాడ్యూల్స్ అందించబడతాయి.

ప్రధాన మెరుగుదలలు టెసెరాక్ట్ 4.1లో:

  • XML ఫార్మాట్‌లో అవుట్‌పుట్ చేసే సామర్థ్యాన్ని జోడించారు ALTO (విశ్లేషణ చేయబడిన లేఅవుట్ మరియు టెక్స్ట్ ఆబ్జెక్ట్). ఈ ఆకృతిని ఉపయోగించడానికి, మీరు అప్లికేషన్‌ను “tessaract image_name alto output_dir”గా అమలు చేయాలి;
  • కొత్త రెండరింగ్ మాడ్యూల్స్ LSTMBox మరియు WordStrBox జోడించబడ్డాయి, ఇంజిన్ శిక్షణను సులభతరం చేస్తుంది;
  • hOCR (HTML) అవుట్‌పుట్‌లో సూడోగ్రాఫిక్స్‌కు మద్దతు జోడించబడింది;
  • మెషీన్ లెర్నింగ్ ఆధారంగా ఇంజిన్‌కు శిక్షణ ఇవ్వడానికి పైథాన్‌లో వ్రాసిన ప్రత్యామ్నాయ స్క్రిప్ట్‌లు జోడించబడ్డాయి;
  • AVX, AVX2 మరియు SSE సూచనలను ఉపయోగించి విస్తరించిన ఆప్టిమైజేషన్‌లు;
  • దీని కారణంగా డిఫాల్ట్‌గా OpenMP మద్దతు నిలిపివేయబడింది సమస్యలు ఉత్పాదకతతో;
  • LSTM ఇంజిన్‌లో తెలుపు మరియు నలుపు జాబితాలకు మద్దతు జోడించబడింది;
  • Cmake ఆధారంగా మెరుగైన బిల్డ్ స్క్రిప్ట్‌లు.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి