ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ವ್ಯವಸ್ಥೆಯ ಬಿಡುಗಡೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ 5.0

Tesseract 4.1 ಆಪ್ಟಿಕಲ್ ಟೆಕ್ಸ್ಟ್ ರೆಕಗ್ನಿಷನ್ ಸಿಸ್ಟಮ್ ಬಿಡುಗಡೆಯನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ, ರಷ್ಯನ್, ಕಝಕ್, ಬೆಲರೂಸಿಯನ್ ಮತ್ತು ಉಕ್ರೇನಿಯನ್ ಸೇರಿದಂತೆ 8 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳಲ್ಲಿ UTF-100 ಅಕ್ಷರಗಳು ಮತ್ತು ಪಠ್ಯಗಳ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಫಲಿತಾಂಶವನ್ನು ಸರಳ ಪಠ್ಯದಲ್ಲಿ ಅಥವಾ HTML (hOCR), ALTO (XML), PDF ಮತ್ತು TSV ಸ್ವರೂಪಗಳಲ್ಲಿ ಉಳಿಸಬಹುದು. ಸಿಸ್ಟಮ್ ಅನ್ನು ಮೂಲತಃ 1985-1995 ರಲ್ಲಿ ಹೆವ್ಲೆಟ್ ಪ್ಯಾಕರ್ಡ್ ಪ್ರಯೋಗಾಲಯದಲ್ಲಿ ರಚಿಸಲಾಯಿತು; 2005 ರಲ್ಲಿ, ಕೋಡ್ ಅನ್ನು ಅಪಾಚೆ ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ತೆರೆಯಲಾಯಿತು ಮತ್ತು ಗೂಗಲ್ ಉದ್ಯೋಗಿಗಳ ಭಾಗವಹಿಸುವಿಕೆಯೊಂದಿಗೆ ಮತ್ತಷ್ಟು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಯಿತು. ಯೋಜನೆಯ ಮೂಲ ಕೋಡ್ ಅನ್ನು Apache 2.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ.

ಟೆಸ್ಸೆರಾಕ್ಟ್ ಇತರ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ OCR ಕಾರ್ಯವನ್ನು ಎಂಬೆಡ್ ಮಾಡಲು ಕನ್ಸೋಲ್ ಉಪಯುಕ್ತತೆ ಮತ್ತು ಲಿಬ್ಟೆಸ್ಸೆರಾಕ್ಟ್ ಲೈಬ್ರರಿಯನ್ನು ಒಳಗೊಂಡಿದೆ. ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅನ್ನು ಬೆಂಬಲಿಸುವ ಮೂರನೇ ವ್ಯಕ್ತಿಯ GUI ಇಂಟರ್ಫೇಸ್‌ಗಳು gImageReader, VietOCR ಮತ್ತು YAGF ಅನ್ನು ಒಳಗೊಂಡಿವೆ. ಎರಡು ಗುರುತಿಸುವಿಕೆ ಎಂಜಿನ್‌ಗಳನ್ನು ನೀಡಲಾಗುತ್ತದೆ: ಪ್ರತ್ಯೇಕ ಅಕ್ಷರ ಮಾದರಿಗಳ ಮಟ್ಟದಲ್ಲಿ ಪಠ್ಯವನ್ನು ಗುರುತಿಸುವ ಕ್ಲಾಸಿಕ್, ಮತ್ತು ಹೊಸದು LSTM ಮರುಕಳಿಸುವ ನರಮಂಡಲದ ಆಧಾರದ ಮೇಲೆ ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಯ ಬಳಕೆಯನ್ನು ಆಧರಿಸಿದೆ, ಸಂಪೂರ್ಣ ತಂತಿಗಳನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಅನುಮತಿಸಲು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾಗಿದೆ. ನಿಖರತೆಯಲ್ಲಿ ಗಮನಾರ್ಹ ಹೆಚ್ಚಳ. 123 ಭಾಷೆಗಳಿಗೆ ಸಿದ್ಧ ತರಬೇತಿ ಮಾದರಿಗಳನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ. ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಉತ್ತಮಗೊಳಿಸಲು, OpenMP ಮತ್ತು SIMD ಸೂಚನೆಗಳನ್ನು ಬಳಸುವ ಮಾಡ್ಯೂಲ್‌ಗಳನ್ನು AVX2, AVX, NEON ಅಥವಾ SSE4.1 ನೀಡಲಾಗುತ್ತದೆ.

Tesseract 5.0 ನಲ್ಲಿನ ಪ್ರಮುಖ ಸುಧಾರಣೆಗಳು:

  • ಆವೃತ್ತಿ ಸಂಖ್ಯೆಯಲ್ಲಿ ಗಮನಾರ್ಹ ಬದಲಾವಣೆಯು API ಗೆ ಮಾಡಿದ ಬದಲಾವಣೆಗಳಿಂದಾಗಿ ಹೊಂದಾಣಿಕೆಯನ್ನು ಮುರಿಯುತ್ತದೆ. ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿರುವ libtesseract API ಇನ್ನು ಮುಂದೆ ಸ್ವಾಮ್ಯದ ಜೆನೆರಿಕ್‌ವೆಕ್ಟರ್ ಮತ್ತು STRING ಡೇಟಾ ಪ್ರಕಾರಗಳಿಗೆ ಸಂಬಂಧಿಸಿಲ್ಲ, std::string ಮತ್ತು std::vector ಪರವಾಗಿ.
  • ಮೂಲ ಪಠ್ಯ ಮರವನ್ನು ಮರುಸಂಘಟಿಸಲಾಗಿದೆ. ಸಾರ್ವಜನಿಕ ಹೆಡರ್ ಫೈಲ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುವ/ಟೆಸ್ಸೆರಾಕ್ಟ್ ಡೈರೆಕ್ಟರಿಗೆ ಸರಿಸಲಾಗಿದೆ.
  • ಮೆಮೊರಿ ನಿರ್ವಹಣೆಯನ್ನು ಮರುವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ, ಎಲ್ಲಾ malloc ಮತ್ತು ಉಚಿತ ಕರೆಗಳನ್ನು C++ ಕೋಡ್‌ನೊಂದಿಗೆ ಬದಲಾಯಿಸಲಾಗಿದೆ. ಕೋಡ್ನ ಸಾಮಾನ್ಯ ಆಧುನೀಕರಣವನ್ನು ಕೈಗೊಳ್ಳಲಾಗಿದೆ.
  • ARM ಮತ್ತು ARM64 ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸೇಶನ್‌ಗಳನ್ನು ಸೇರಿಸಲಾಗಿದೆ; ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ವೇಗಗೊಳಿಸಲು ARM NEON ಸೂಚನೆಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಎಲ್ಲಾ ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳಿಗೆ ಸಾಮಾನ್ಯವಾದ ಕಾರ್ಯಕ್ಷಮತೆಯ ಆಪ್ಟಿಮೈಸೇಶನ್ ಅನ್ನು ಕೈಗೊಳ್ಳಲಾಗಿದೆ.
  • ಫ್ಲೋಟಿಂಗ್ ಪಾಯಿಂಟ್ ಲೆಕ್ಕಾಚಾರಗಳ ಬಳಕೆಯ ಆಧಾರದ ಮೇಲೆ ತರಬೇತಿ ಮಾದರಿಗಳು ಮತ್ತು ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆಗಾಗಿ ಹೊಸ ವಿಧಾನಗಳನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ. ಹೊಸ ವಿಧಾನಗಳು ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಕಡಿಮೆ ಮೆಮೊರಿ ಬಳಕೆಯನ್ನು ನೀಡುತ್ತವೆ. LSTM ಎಂಜಿನ್‌ನಲ್ಲಿ, float32 ಫಾಸ್ಟ್ ಮೋಡ್ ಅನ್ನು ಪೂರ್ವನಿಯೋಜಿತವಾಗಿ ಸಕ್ರಿಯಗೊಳಿಸಲಾಗಿದೆ.
  • ಎನ್‌ಎಫ್‌ಸಿ (ನಾರ್ಮಲೈಸೇಶನ್ ಫಾರ್ಮ್ ಕ್ಯಾನೊನಿಕಲ್) ಫಾರ್ಮ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಯುನಿಕೋಡ್ ಸಾಮಾನ್ಯೀಕರಣವನ್ನು ಬಳಸುವುದಕ್ಕೆ ಪರಿವರ್ತನೆ ಮಾಡಲಾಗಿದೆ.
  • ಲಾಗ್ ವಿವರಗಳನ್ನು ಕಾನ್ಫಿಗರ್ ಮಾಡಲು ಒಂದು ಆಯ್ಕೆಯನ್ನು ಸೇರಿಸಲಾಗಿದೆ (--loglevel).
  • Autotools ಆಧಾರಿತ ಬಿಲ್ಡ್ ಸಿಸ್ಟಮ್ ಅನ್ನು ಮರುವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಮತ್ತು ಪುನರಾವರ್ತಿತವಲ್ಲದ ಮೋಡ್‌ನಲ್ಲಿ ನಿರ್ಮಿಸಲು ಬದಲಾಯಿಸಲಾಗಿದೆ.
  • Git ನಲ್ಲಿನ "ಮಾಸ್ಟರ್" ಶಾಖೆಯನ್ನು "ಮುಖ್ಯ" ಎಂದು ಮರುನಾಮಕರಣ ಮಾಡಲಾಗಿದೆ.
  • M1 ಚಿಪ್‌ನ ಆಧಾರದ ಮೇಲೆ MacOS ಮತ್ತು Apple ಸಿಸ್ಟಮ್‌ಗಳ ಹೊಸ ಬಿಡುಗಡೆಗಳಿಗೆ ಬೆಂಬಲವನ್ನು ಸೇರಿಸಲಾಗಿದೆ.

    ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ