టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ యొక్క విడుదల Tesseract 5.3.4

Tesseract 5.3.4 ఆప్టికల్ టెక్స్ట్ రికగ్నిషన్ సిస్టమ్ విడుదల ప్రచురించబడింది, రష్యన్, కజఖ్, బెలారసియన్ మరియు ఉక్రేనియన్‌లతో సహా 8 కంటే ఎక్కువ భాషల్లో UTF-100 అక్షరాలు మరియు టెక్స్ట్‌ల గుర్తింపుకు మద్దతు ఇస్తుంది. ఫలితాన్ని సాదా వచనంలో లేదా HTML (hOCR), ALTO (XML), PDF మరియు TSV ఫార్మాట్‌లలో సేవ్ చేయవచ్చు. ఈ వ్యవస్థ వాస్తవానికి 1985-1995లో హ్యూలెట్ ప్యాకర్డ్ ప్రయోగశాలలో సృష్టించబడింది; 2005లో, ఈ కోడ్ అపాచీ లైసెన్స్ క్రింద తెరవబడింది మరియు Google ఉద్యోగుల భాగస్వామ్యంతో మరింత అభివృద్ధి చేయబడింది. ప్రాజెక్ట్ యొక్క సోర్స్ కోడ్ Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడింది.

Tesseract ఇతర అప్లికేషన్‌లలో OCR కార్యాచరణను పొందుపరచడానికి కన్సోల్ యుటిలిటీ మరియు libtesseract లైబ్రరీని కలిగి ఉంటుంది. టెస్సెరాక్ట్‌కు మద్దతు ఇచ్చే థర్డ్-పార్టీ GUI ఇంటర్‌ఫేస్‌లలో gImageReader, VietOCR మరియు YAGF ఉన్నాయి. రెండు రికగ్నిషన్ ఇంజన్‌లు అందించబడ్డాయి: వ్యక్తిగత అక్షర నమూనాల స్థాయిలో వచనాన్ని గుర్తించే క్లాసిక్ ఒకటి మరియు LSTM పునరావృత న్యూరల్ నెట్‌వర్క్ ఆధారంగా మెషీన్ లెర్నింగ్ సిస్టమ్ యొక్క ఉపయోగం ఆధారంగా కొత్తది, మొత్తం స్ట్రింగ్‌లను గుర్తించడానికి మరియు అనుమతించడానికి అనుకూలీకరించబడింది. ఖచ్చితత్వంలో గణనీయమైన పెరుగుదల. 123 భాషల కోసం రెడీమేడ్ శిక్షణ పొందిన నమూనాలు ప్రచురించబడ్డాయి. పనితీరును ఆప్టిమైజ్ చేయడానికి, OpenMP మరియు SIMD సూచనలను ఉపయోగించి మాడ్యూల్స్ AVX2, AVX, AVX512F, NEON లేదా SSE4.1 అందించబడతాయి.

ప్రధాన మెరుగుదలలు:

  • libcurl లైబ్రరీని ఉపయోగించి ఫైల్ డౌన్‌లోడ్‌తో URL ద్వారా ఇమేజ్ రికగ్నిషన్ మెరుగుపరచబడింది. లోడ్ అవుతున్నప్పుడు, వినియోగదారు ఏజెంట్ హెడర్ సెట్ చేయబడింది. కుక్కీ ఫైల్‌ని ఉపయోగించడం కోసం curl_cookiefile కొత్త పరామితి జోడించబడింది.
  • ScrollView సర్వర్ TCPని దాని ప్రాధాన్య ప్రోటోకాల్‌గా ఉపయోగిస్తుంది.
  • "combine_tessdata -d" ఆదేశాన్ని ఉపయోగిస్తున్నప్పుడు, అవుట్‌పుట్ stderrకి బదులుగా stdoutకి అందించబడుతుంది.
  • autoconf మరియు గణగణమని ద్వని చేస్తున్నప్పుడు స్థిర బిల్డ్ సమస్యలు.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి