டெஸராக்ட் 5.0 உரை அங்கீகார அமைப்பின் வெளியீடு

Tesseract 4.1 ஆப்டிகல் டெக்ஸ்ட் ரெகக்னிஷன் சிஸ்டத்தின் வெளியீடு வெளியிடப்பட்டது, இது UTF-8 எழுத்துக்கள் மற்றும் 100க்கும் மேற்பட்ட மொழிகளில் ரஷ்ய, கசாக், பெலாரஷ்யன் மற்றும் உக்ரேனிய மொழிகளில் உள்ள உரைகளின் அங்கீகாரத்தை ஆதரிக்கிறது. முடிவை எளிய உரையில் அல்லது HTML (hOCR), ALTO (XML), PDF மற்றும் TSV வடிவங்களில் சேமிக்கலாம். இந்த அமைப்பு முதலில் 1985-1995 இல் ஹெவ்லெட் பேக்கர்டின் ஆய்வகத்தில் உருவாக்கப்பட்டது; 2005 இல், இந்த குறியீடு அப்பாச்சி உரிமத்தின் கீழ் திறக்கப்பட்டது மற்றும் கூகிள் ஊழியர்களின் பங்கேற்புடன் மேலும் உருவாக்கப்பட்டது. திட்டத்தின் மூலக் குறியீடு Apache 2.0 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது.

டெசெராக்ட் ஒரு கன்சோல் பயன்பாடு மற்றும் பிற பயன்பாடுகளில் OCR செயல்பாட்டை உட்பொதிப்பதற்கான libtesseract நூலகத்தை உள்ளடக்கியது. டெஸராக்டை ஆதரிக்கும் மூன்றாம் தரப்பு GUI இடைமுகங்களில் gImageReader, VietOCR மற்றும் YAGF ஆகியவை அடங்கும். இரண்டு அங்கீகார இயந்திரங்கள் வழங்கப்படுகின்றன: தனித்தனி எழுத்து வடிவங்களின் அளவில் உரையை அங்கீகரிக்கும் உன்னதமானது, மற்றும் புதியது LSTM மறுநிகழ்வு நரம்பியல் வலையமைப்பை அடிப்படையாகக் கொண்ட இயந்திர கற்றல் அமைப்பின் பயன்பாட்டை அடிப்படையாகக் கொண்டது, இது முழு சரங்களையும் அங்கீகரிப்பதற்காக உகந்ததாக உள்ளது. துல்லியத்தில் குறிப்பிடத்தக்க அதிகரிப்பு. 123 மொழிகளுக்கான ஆயத்த பயிற்சி பெற்ற மாதிரிகள் வெளியிடப்பட்டுள்ளன. செயல்திறனை மேம்படுத்த, OpenMP மற்றும் SIMD வழிமுறைகளைப் பயன்படுத்தும் தொகுதிகள் AVX2, AVX, NEON அல்லது SSE4.1 வழங்கப்படுகின்றன.

Tesseract 5.0 இல் முக்கிய மேம்பாடுகள்:

  • பதிப்பு எண்ணில் குறிப்பிடத்தக்க மாற்றம் ஏபிஐயில் செய்யப்பட்ட மாற்றங்களால் பொருந்தக்கூடிய தன்மையை உடைக்கிறது. குறிப்பாக, பொதுவில் கிடைக்கும் libtesseract API ஆனது, std::string மற்றும் std::vector க்கு ஆதரவாக, தனியுரிமமான GenericVector மற்றும் STRING தரவு வகைகளுடன் இணைக்கப்படாது.
  • மூல உரை மரம் மறுசீரமைக்கப்பட்டுள்ளது. பொது தலைப்பு கோப்புகள் அடங்கும்/டெசராக்ட் கோப்பகத்திற்கு நகர்த்தப்பட்டுள்ளன.
  • நினைவக மேலாண்மை மறுவடிவமைப்பு செய்யப்பட்டுள்ளது, அனைத்து malloc மற்றும் இலவச அழைப்புகள் C++ குறியீட்டுடன் மாற்றப்பட்டுள்ளன. குறியீட்டின் பொதுவான நவீனமயமாக்கல் மேற்கொள்ளப்பட்டுள்ளது.
  • ARM மற்றும் ARM64 கட்டமைப்புகளுக்கான மேம்படுத்தல்கள் சேர்க்கப்பட்டது; கணக்கீடுகளை விரைவுபடுத்த ARM NEON வழிமுறைகள் பயன்படுத்தப்படுகின்றன. அனைத்து கட்டமைப்புகளுக்கும் பொதுவான செயல்திறன் மேம்படுத்தல் மேற்கொள்ளப்பட்டுள்ளது.
  • மிதக்கும் புள்ளி கணக்கீடுகளின் பயன்பாட்டின் அடிப்படையில் பயிற்சி மாதிரிகள் மற்றும் உரை அங்கீகாரத்திற்கான புதிய முறைகள் செயல்படுத்தப்பட்டுள்ளன. புதிய முறைகள் அதிக செயல்திறன் மற்றும் குறைந்த நினைவக நுகர்வு ஆகியவற்றை வழங்குகின்றன. எல்எஸ்டிஎம் எஞ்சினில், ஃப்ளோட்32 ஃபாஸ்ட் பயன்முறை இயல்பாகவே இயக்கப்படுகிறது.
  • NFC (நார்மலைசேஷன் ஃபார்ம் கேனானிகல்) படிவத்தைப் பயன்படுத்தி யூனிகோட் இயல்பாக்கத்தைப் பயன்படுத்துவதற்கான மாற்றம் செய்யப்பட்டுள்ளது.
  • பதிவு விவரத்தை உள்ளமைக்க ஒரு விருப்பம் சேர்க்கப்பட்டது (--loglevel).
  • Autotools அடிப்படையிலான பில்ட் சிஸ்டம் மறுவடிவமைப்பு செய்யப்பட்டு, மறுசுழற்சி அல்லாத பயன்முறையில் உருவாக்க மாற்றப்பட்டது.
  • Git இல் உள்ள "மாஸ்டர்" கிளை "முதன்மை" என மறுபெயரிடப்பட்டது.
  • M1 சிப்பின் அடிப்படையில் MacOS மற்றும் Apple அமைப்புகளின் புதிய வெளியீடுகளுக்கான ஆதரவு சேர்க்கப்பட்டது.

    ஆதாரம்: opennet.ru

கருத்தைச் சேர்