පෙළ හඳුනාගැනීමේ පද්ධතිය නිකුත් කිරීම Tesseract 5.0

රුසියානු, කසකස්, බෙලරුසියානු සහ යුක්රේනියානු ඇතුළු භාෂා 4.1කට වඩා වැඩි ගණනකින් UTF-8 අක්ෂර සහ පෙළ හඳුනා ගැනීමට සහාය වන Tesseract 100 දෘශ්‍ය පෙළ හඳුනාගැනීමේ පද්ධතිය ප්‍රකාශයට පත් කර ඇත. ප්‍රතිඵලය සරල පාඨයෙන් හෝ HTML (hOCR), ALTO (XML), PDF සහ TSV ආකෘතිවලින් සුරැකිය හැක. පද්ධතිය මුලින් 1985-1995 Hewlett Packard රසායනාගාරයේ නිර්මාණය කරන ලදී; 2005 දී, කේතය Apache බලපත්‍රය යටතේ විවෘත කරන ලද අතර Google සේවකයින්ගේ සහභාගීත්වයෙන් එය තවදුරටත් සංවර්ධනය කරන ලදී. ව්‍යාපෘතියේ මූල කේතය Apache 2.0 බලපත්‍රය යටතේ බෙදා හැරේ.

වෙනත් යෙදුම් වලට OCR ක්‍රියාකාරීත්වය කාවැද්දීම සඳහා Tesseract හි කොන්සෝල උපයෝගිතා සහ libtesseract පුස්තකාලය ඇතුළත් වේ. Tesseract සඳහා සහාය දක්වන තෙවන පාර්ශවීය GUI අතුරුමුහුණත් අතර gImageReader, VietOCR සහ YAGF ඇතුළත් වේ. හඳුනාගැනීමේ එන්ජින් දෙකක් පිරිනමනු ලැබේ: තනි අක්ෂර රටා මට්ටමින් පෙළ හඳුනා ගන්නා සම්භාව්‍ය එකක් සහ LSTM පුනරාවර්තන ස්නායුක ජාලයක් මත පදනම් වූ යන්ත්‍ර ඉගෙනුම් පද්ධතියක් භාවිතා කිරීම මත පදනම් වූ නව එකක්, සම්පූර්ණ තන්තු හඳුනා ගැනීමට සහ ඉඩ දීමට ප්‍රශස්ත කර ඇත. නිරවද්යතාවයේ සැලකිය යුතු වැඩි වීමක්. සූදානම් පුහුණු ආකෘති භාෂා 123 සඳහා ප්‍රකාශයට පත් කර ඇත. කාර්ය සාධනය ප්‍රශස්ත කිරීම සඳහා, OpenMP සහ SIMD උපදෙස් භාවිතා කරන මොඩියුල AVX2, AVX, NEON හෝ SSE4.1 පිරිනමනු ලැබේ.

Tesseract 5.0 හි ප්‍රධාන වැඩිදියුණු කිරීම්:

  • අනුවාද අංකයෙහි සැලකිය යුතු වෙනසක් API හි අනුකූලතාව බිඳ දැමූ වෙනස්කම් නිසාය. විශේෂයෙන්ම, ප්‍රසිද්ධියේ ලබා ගත හැකි libtesseract API තවදුරටත් හිමිකාර GenericVector සහ STRING දත්ත වර්ගවලට, std::string සහ std::vector සඳහා සම්බන්ධ නොවේ.
  • මූලාශ්‍ර පෙළ ගස ප්‍රතිසංවිධානය කර ඇත. පොදු ශීර්ෂ ගොනු ඇතුලත්/ටෙසරැක්ට් නාමාවලිය වෙත ගෙන ගොස් ඇත.
  • මතක කළමනාකරණය ප්‍රතිනිර්මාණය කර ඇත, සියලුම malloc සහ නොමිලේ ඇමතුම් C++ කේතය සමඟ ප්‍රතිස්ථාපනය කර ඇත. කේතයේ සාමාන්ය නවීකරණයක් සිදු කර ඇත.
  • ARM සහ ARM64 ගෘහනිර්මාණ සඳහා ප්‍රශස්තකරණයන් එකතු කරන ලදි; ගණනය කිරීම් වේගවත් කිරීමට ARM NEON උපදෙස් භාවිතා කරයි. සියලුම ගෘහ නිර්මාණ ශිල්පයට පොදු කාර්ය සාධන ප්‍රශස්තිකරණය සිදු කර ඇත.
  • පාවෙන ලක්ෂ්‍ය ගණනය කිරීම් භාවිතය මත පදනම් වූ පුහුණු ආකෘති සහ පෙළ හඳුනාගැනීම සඳහා නව මාදිලි ක්‍රියාත්මක කර ඇත. නව මාදිලි ඉහළ කාර්ය සාධනයක් සහ අඩු මතක පරිභෝජනයක් ලබා දෙයි. LSTM එන්ජිම තුළ, float32 වේගවත් මාදිලිය පෙරනිමියෙන් සක්‍රීය කර ඇත.
  • NFC (සාමාන්‍යකරණ පෝරමය කැනොනිකල්) පෝරමය භාවිතයෙන් යුනිකෝඩ් සාමාන්‍යකරණය භාවිතා කිරීමට සංක්‍රමණයක් සිදු කර ඇත.
  • ලොග් විස්තර වින්‍යාස කිරීමට විකල්පයක් එක් කරන ලදී (--loglevel).
  • Autotools මත පදනම් වූ ගොඩනැගීම් පද්ධතිය ප්‍රතිනිර්මාණය කර ඇති අතර ප්‍රත්‍යාවර්තී නොවන ආකාරයෙන් ගොඩනැගීමට මාරු කර ඇත.
  • Git හි "මාස්ටර්" ශාඛාව "ප්‍රධාන" ලෙස නැවත නම් කර ඇත.
  • M1 චිපය මත පදනම් වූ macOS සහ Apple පද්ධතිවල නව නිකුතු සඳහා සහය එක් කරන ලදී.

    මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න