Tesseract 4.1 āĻ āĻĒāĻāĻŋāĻā§āĻ¯āĻžāĻ˛ āĻā§āĻā§āĻ¸āĻ āĻ°āĻŋāĻāĻāĻ¨āĻŋāĻļāĻ¨ āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽā§āĻ° āĻ°āĻŋāĻ˛āĻŋāĻ āĻĒā§āĻ°āĻāĻžāĻļāĻŋāĻ¤ āĻšāĻ¯āĻŧā§āĻā§, āĻ¯āĻž āĻ°āĻžāĻļāĻŋāĻ¯āĻŧāĻžāĻ¨, āĻāĻžāĻāĻžāĻ, āĻŦā§āĻ˛āĻžāĻ°ā§āĻļāĻŋāĻ¯āĻŧāĻžāĻ¨ āĻāĻŦāĻ āĻāĻāĻā§āĻ°ā§āĻ¨ā§āĻ¯āĻŧ āĻ¸āĻš 8 āĻāĻŋāĻ°āĻ āĻŦā§āĻļāĻŋ āĻāĻžāĻˇāĻžāĻ¯āĻŧ UTF-100 āĻ āĻā§āĻˇāĻ° āĻāĻŦāĻ āĻĒāĻžāĻ ā§āĻ¯ā§āĻ° āĻ¸ā§āĻŦā§āĻā§āĻ¤āĻŋ āĻ¸āĻŽāĻ°ā§āĻĨāĻ¨ āĻāĻ°ā§āĨ¤ āĻĢāĻ˛āĻžāĻĢāĻ˛āĻāĻŋ āĻĒāĻ°āĻŋāĻˇā§āĻāĻžāĻ° āĻĒāĻžāĻ ā§āĻ¯ āĻāĻŦāĻ HTML (hOCR), ALTO (XML), PDF āĻāĻŦāĻ TSV āĻĢāĻ°ā§āĻŽā§āĻ¯āĻžāĻā§ āĻāĻāĻ¯āĻŧāĻ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻž āĻ¯ā§āĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤ āĻĒā§āĻ°āĻžāĻĨāĻŽāĻŋāĻāĻāĻžāĻŦā§, āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽāĻāĻŋ 1985-1995 āĻ¸āĻžāĻ˛ā§ āĻšāĻŋāĻāĻ˛ā§āĻ āĻĒā§āĻ¯āĻžāĻāĻžāĻ°ā§āĻĄā§āĻ° āĻĒāĻ°ā§āĻā§āĻˇāĻžāĻāĻžāĻ°ā§ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻāĻŋāĻ˛, 2005 āĻ¸āĻžāĻ˛ā§ āĻā§āĻĄāĻāĻŋ āĻ ā§āĻ¯āĻžāĻĒāĻžāĻāĻŋ āĻ˛āĻžāĻāĻ¸ā§āĻ¨ā§āĻ¸ā§āĻ° āĻ āĻ§ā§āĻ¨ā§ āĻā§āĻ˛āĻž āĻšāĻ¯āĻŧā§āĻāĻŋāĻ˛ āĻāĻŦāĻ Google āĻāĻ°ā§āĻŽā§āĻĻā§āĻ° āĻ āĻāĻļāĻā§āĻ°āĻšāĻŖā§ āĻāĻ°āĻ āĻŦāĻŋāĻāĻžāĻļ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻāĻŋāĻ˛āĨ¤ āĻĒā§āĻ°āĻāĻ˛ā§āĻĒā§āĻ° āĻāĻ¤ā§āĻ¸ āĻĒāĻžāĻ ā§āĻ¯āĻā§āĻ˛āĻŋ Apache 2.0 āĻ˛āĻžāĻāĻ¸ā§āĻ¨ā§āĻ¸ā§āĻ° āĻ āĻ§ā§āĻ¨ā§ āĻŦāĻŋāĻ¤āĻ°āĻŖ āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤
Tesseract āĻāĻāĻāĻŋ āĻāĻ¨āĻ¸ā§āĻ˛ āĻāĻāĻāĻŋāĻ˛āĻŋāĻāĻŋ āĻāĻŦāĻ āĻ āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻ ā§āĻ¯āĻžāĻĒā§āĻ˛āĻŋāĻā§āĻļāĻ¨ā§ OCR āĻāĻžāĻ°ā§āĻ¯āĻāĻžāĻ°āĻŋāĻ¤āĻž āĻāĻŽāĻŦā§āĻĄ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ libtesseract āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋ āĻ āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻāĻ°ā§āĨ¤ Tesseract-āĻ¸āĻŽāĻ°ā§āĻĨāĻ āĻ¤ā§āĻ¤ā§āĻ¯āĻŧ āĻĒāĻā§āĻˇā§āĻ° GUI-āĻāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻ°āĻ¯āĻŧā§āĻā§ gImageReader, VietOCR, āĻāĻŦāĻ YAGFāĨ¤ āĻĻā§āĻāĻŋ āĻ¸ā§āĻŦā§āĻā§āĻ¤āĻŋ āĻāĻā§āĻāĻŋāĻ¨ āĻĒā§āĻ°āĻ¸ā§āĻ¤āĻžāĻŦ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§: āĻāĻāĻāĻŋ āĻā§āĻ˛āĻžāĻ¸āĻŋāĻ āĻ¯āĻž āĻ¸ā§āĻŦāĻ¤āĻ¨ā§āĻ¤ā§āĻ° āĻ āĻā§āĻˇāĻ° āĻĒā§āĻ¯āĻžāĻāĻžāĻ°ā§āĻ¨ā§āĻ° āĻ¸ā§āĻ¤āĻ°ā§ āĻĒāĻžāĻ ā§āĻ¯āĻā§ āĻ¸ā§āĻŦā§āĻā§āĻ¤āĻŋ āĻĻā§āĻ¯āĻŧ āĻāĻŦāĻ āĻāĻāĻāĻŋ āĻ¨āĻ¤ā§āĻ¨ āĻāĻāĻāĻŋ āĻŽā§āĻļāĻŋāĻ¨ āĻ˛āĻžāĻ°ā§āĻ¨āĻŋāĻ āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽā§āĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§āĻ° āĻāĻĒāĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋ āĻāĻ°ā§ āĻāĻāĻāĻŋ āĻĒā§āĻ¨āĻ°āĻžāĻŦā§āĻ¤ā§āĻ¤ āĻ¨āĻŋāĻāĻ°āĻžāĻ˛ āĻ¨ā§āĻāĻāĻ¯āĻŧāĻžāĻ°ā§āĻ LSTM-āĻāĻ° āĻāĻĒāĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋ āĻāĻ°ā§, āĻ¸āĻŽā§āĻĒā§āĻ°ā§āĻŖ āĻ˛āĻžāĻāĻ¨ā§āĻ° āĻ¸ā§āĻŦā§āĻā§āĻ¤āĻŋāĻ° āĻāĻ¨ā§āĻ¯ āĻ āĻĒā§āĻāĻŋāĻŽāĻžāĻāĻ āĻāĻ°āĻž āĻāĻŦāĻ āĻāĻāĻāĻŋ āĻ āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§āĻ¯āĻŧ āĻ¨āĻŋāĻ°ā§āĻā§āĻ˛āĻ¤āĻž āĻāĻ˛ā§āĻ˛ā§āĻāĻ¯ā§āĻā§āĻ¯ āĻŦā§āĻĻā§āĻ§āĻŋāĨ¤ 123āĻāĻŋ āĻāĻžāĻˇāĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤ āĻĒā§āĻ°āĻļāĻŋāĻā§āĻˇāĻŋāĻ¤ āĻŽāĻĄā§āĻ˛ āĻĒā§āĻ°āĻāĻžāĻļāĻŋāĻ¤ āĻšāĻ¯āĻŧā§āĻā§āĨ¤ āĻāĻ°ā§āĻŽāĻā§āĻˇāĻŽāĻ¤āĻž āĻ āĻĒā§āĻāĻŋāĻŽāĻžāĻāĻ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻŽāĻĄāĻŋāĻāĻ˛āĻā§āĻ˛āĻŋ āĻ āĻĢāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧ āĻ¯āĻž OpenMP āĻāĻŦāĻ SIMD āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļāĻžāĻŦāĻ˛ā§ AVX2, AVX, NEON āĻŦāĻž SSE4.1 āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ā§ˇ
Tesseract 5.0 āĻ āĻŽā§āĻ˛ āĻāĻ¨ā§āĻ¨āĻ¤āĻŋ:
- āĻāĻ˛ā§āĻ˛ā§āĻāĻ¯ā§āĻā§āĻ¯ āĻ¸āĻāĻ¸ā§āĻāĻ°āĻŖ āĻ¨āĻŽā§āĻŦāĻ° āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨āĻāĻŋ API-āĻ¤ā§ āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨ā§āĻ° āĻāĻžāĻ°āĻŖā§ āĻšāĻ¯āĻŧā§āĻā§ āĻ¯āĻž āĻ¸āĻžāĻŽāĻā§āĻāĻ¸ā§āĻ¯ āĻāĻā§āĻ āĻāĻ°ā§āĨ¤ āĻŦāĻŋāĻļā§āĻˇ āĻāĻ°ā§, āĻ¸āĻ°ā§āĻŦāĻāĻ¨ā§āĻ¨āĻāĻžāĻŦā§ āĻāĻĒāĻ˛āĻŦā§āĻ§ libtesseract API āĻāĻ° āĻŽāĻžāĻ˛āĻŋāĻāĻžāĻ¨āĻž āĻĄā§āĻāĻž āĻĒā§āĻ°āĻāĻžāĻ° GenericVector āĻāĻŦāĻ STRING āĻāĻ° āĻ¸āĻžāĻĨā§ āĻāĻŦāĻĻā§āĻ§ āĻ¨āĻ¯āĻŧ, āĻ¯āĻžāĻ° āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤ā§ āĻā§āĻĄā§ std::string āĻāĻŦāĻ std::vector āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤
- āĻā§āĻ¸ āĻāĻžāĻ āĻĒā§āĻ¨āĻ°ā§āĻāĻ āĻ¨ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§. āĻĒāĻžāĻŦāĻ˛āĻŋāĻ āĻšā§āĻĄāĻžāĻ° āĻĢāĻžāĻāĻ˛āĻā§āĻ˛āĻŋ āĻ āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤/āĻā§āĻ¸āĻžāĻ°ā§āĻ¯āĻžāĻā§āĻ āĻĄāĻŋāĻ°ā§āĻā§āĻāĻ°āĻŋāĻ¤ā§ āĻ¸āĻ°āĻžāĻ¨ā§ āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- āĻŽā§āĻŽāĻ°āĻŋ āĻŽā§āĻ¯āĻžāĻ¨ā§āĻāĻŽā§āĻ¨ā§āĻ āĻ¨āĻ¤ā§āĻ¨ āĻāĻ°ā§ āĻĄāĻŋāĻāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§, malloc āĻāĻŦāĻ āĻŦāĻŋāĻ¨āĻžāĻŽā§āĻ˛ā§āĻ¯ā§āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻ˛ C++ āĻā§āĻĄ āĻĻāĻŋāĻ¯āĻŧā§ āĻĒā§āĻ°āĻ¤āĻŋāĻ¸ā§āĻĨāĻžāĻĒāĻŋāĻ¤ āĻšāĻ¯āĻŧā§āĻā§āĨ¤ āĻāĻāĻāĻŋ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖ āĻā§āĻĄ āĻāĻĒāĻā§āĻ°ā§āĻĄ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- ARM āĻāĻŦāĻ ARM64 āĻāĻ°ā§āĻāĻŋāĻā§āĻāĻāĻžāĻ°ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ āĻĒā§āĻāĻŋāĻŽāĻžāĻāĻā§āĻļāĻ¨ āĻ¯ā§āĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§, ARM NEON āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļāĻžāĻŦāĻ˛ā§ āĻāĻŖāĻ¨āĻžāĻ° āĻāĻ¤āĻŋ āĻŦāĻžāĻĄāĻŧāĻžāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻ°ā§āĻāĻŋāĻā§āĻāĻāĻžāĻ°ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖ āĻāĻ°ā§āĻŽāĻā§āĻˇāĻŽāĻ¤āĻž āĻ āĻĒā§āĻāĻŋāĻŽāĻžāĻāĻā§āĻļāĻžāĻ¨ āĻ¸āĻā§āĻāĻžāĻ˛āĻŋāĻ¤ āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- āĻĢā§āĻ˛ā§āĻāĻŋāĻ āĻĒāĻ¯āĻŧā§āĻ¨ā§āĻ āĻāĻŖāĻ¨āĻžāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§āĻ° āĻāĻĒāĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋ āĻāĻ°ā§ āĻŽāĻĄā§āĻ˛ āĻĒā§āĻ°āĻļāĻŋāĻā§āĻˇāĻŖ āĻāĻŦāĻ āĻĒāĻžāĻ ā§āĻ¯ āĻ¸ā§āĻŦā§āĻā§āĻ¤āĻŋāĻ° āĻ¨āĻ¤ā§āĻ¨ āĻŽā§āĻĄ āĻĒā§āĻ°āĻ¯āĻŧā§āĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤ āĻ¨āĻ¤ā§āĻ¨ āĻŽā§āĻĄ āĻāĻā§āĻ āĻāĻ°ā§āĻŽāĻā§āĻˇāĻŽāĻ¤āĻž āĻāĻŦāĻ āĻšā§āĻ°āĻžāĻ¸ āĻŽā§āĻŽāĻ°āĻŋ āĻāĻ°āĻ āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻŋāĻšā§āĻ¨āĻŋāĻ¤ āĻāĻ°āĻž āĻšāĻ¯āĻŧ. LSTM āĻāĻā§āĻāĻŋāĻ¨ā§, float32 āĻĢāĻžāĻ¸ā§āĻ āĻŽā§āĻĄ āĻĄāĻŋāĻĢāĻ˛ā§āĻāĻ°ā§āĻĒā§ āĻ¸āĻā§āĻ°āĻŋāĻ¯āĻŧ āĻĨāĻžāĻā§āĨ¤
- āĻāĻ¨āĻāĻĢāĻ¸āĻŋ āĻĢāĻ°ā§āĻŽ (āĻ¨āĻ°āĻŽāĻžāĻ˛āĻžāĻāĻā§āĻļāĻ¨ āĻĢāĻ°ā§āĻŽ āĻā§āĻ¯āĻžāĻ¨ā§āĻ¨āĻŋāĻāĻžāĻ˛) āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻāĻāĻ¨āĻŋāĻā§āĻĄ āĻ¸ā§āĻŦāĻžāĻāĻžāĻŦāĻŋāĻāĻāĻ°āĻŖā§āĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°ā§ āĻ°ā§āĻĒāĻžāĻ¨ā§āĻ¤āĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- āĻ˛āĻ āĻŦāĻŋāĻļāĻĻ (-āĻ˛āĻāĻ˛ā§āĻā§āĻ˛) āĻāĻ¨āĻĢāĻŋāĻāĻžāĻ° āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻāĻāĻŋ āĻŦāĻŋāĻāĻ˛ā§āĻĒ āĻ¯ā§āĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- Autotools-āĻāĻ° āĻāĻĒāĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋ āĻāĻ°ā§ āĻ ā§āĻ¯āĻžāĻ¸ā§āĻŽā§āĻŦāĻ˛āĻŋ āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽāĻāĻŋāĻā§ āĻāĻŦāĻžāĻ° āĻĄāĻŋāĻāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§, āĻ¯āĻž āĻ¨āĻ¨-āĻ°āĻŋāĻāĻžāĻ°āĻ¸āĻŋāĻ āĻŽā§āĻĄā§ āĻ ā§āĻ¯āĻžāĻ¸ā§āĻŽā§āĻŦāĻ˛āĻŋāĻ¤ā§ āĻ¸ā§āĻ¯ā§āĻāĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- Git-āĻ 'āĻŽāĻžāĻ¸ā§āĻāĻžāĻ°' āĻļāĻžāĻāĻžāĻ° āĻ¨āĻžāĻŽ āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨ āĻāĻ°ā§ 'āĻĒā§āĻ°āĻ§āĻžāĻ¨' āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
- M1 āĻāĻŋāĻĒā§āĻ° āĻāĻĒāĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋ āĻāĻ°ā§ macOS āĻāĻŦāĻ Apple āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽā§āĻ° āĻ¨āĻ¤ā§āĻ¨ āĻ°āĻŋāĻ˛āĻŋāĻā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ¸āĻŽāĻ°ā§āĻĨāĻ¨ āĻ¯ā§āĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤
āĻāĻ¤ā§āĻ¸: opennet.ru