Hoʻokuʻu ʻia o ka ʻōnaehana ʻike kikokikona Tesseract 5.0

Ua paʻi ʻia ka hoʻokuʻu ʻana o Tesseract 4.1 optical text recognition system, e kākoʻo ana i ka ʻike ʻana i nā huaʻōlelo UTF-8 a me nā kikokikona ma mua o 100 mau ʻōlelo, me ka Russian, Kazakh, Belarusian a me Ukrainian. Hiki ke mālama ʻia ka hopena ma ka kikokikona maʻamau a i ʻole HTML (hOCR), ALTO (XML), PDF a me nā palapala TSV. Ua hoʻokumu mua ʻia ka ʻōnaehana ma 1985-1995 i ka hale hana Hewlett Packard; ma 2005, ua wehe ʻia ke code ma lalo o ka laikini Apache a ua hoʻomohala hou ʻia me ke komo ʻana o nā limahana Google. Hāʻawi ʻia ke kumu kumu o ka papahana ma lalo o ka laikini Apache 2.0.

Loaʻa iā Tesseract kahi mea hoʻohana console a me ka waihona libtesseract no ka hoʻopili ʻana i ka hana OCR i nā noi ʻē aʻe. ʻO nā loulou GUI ʻaoʻao ʻekolu e kākoʻo ana iā Tesseract me gImageReader, VietOCR a me YAGF. Hāʻawi ʻia ʻelua ʻenekini hoʻomaopopo: ʻo kahi mea maʻamau e ʻike i ke kikokikona ma ke ʻano o nā ʻano hiʻohiʻona o kēlā me kēia kanaka, a me kahi mea hou e pili ana i ka hoʻohana ʻana i kahi ʻōnaehana aʻo mīkini e pili ana i kahi LSTM recurrent neural network, i hoʻopaʻa ʻia no ka ʻike ʻana i nā kaula holoʻokoʻa a hiki i kahi. piʻi nui i ka pololei. Ua paʻi ʻia nā kumu hoʻohālike i mākaukau no 123 mau ʻōlelo. No ka hoʻomaikaʻi ʻana i ka hana, hāʻawi ʻia nā modula e hoʻohana ana i nā kuhikuhi OpenMP a me SIMD AVX2, AVX, NEON a i ʻole SSE4.1.

Nā hoʻomaikaʻi nui ma Tesseract 5.0:

  • ʻO kahi hoʻololi koʻikoʻi o ka helu mana ma muli o nā loli i hana ʻia i ka API e haki ana i ka hoʻohālikelike. ʻO ka mea nui, ʻaʻole pili hou ka API libtesseract i loaʻa i ka lehulehu i nā ʻano ʻikepili GenericVector a me STRING, no ka std :: string a me std :: vector.
  • Ua hoʻonohonoho hou ʻia ke kumu kumu kikokikona. Ua hoʻoneʻe ʻia nā faila poʻomanaʻo lehulehu i ka papa kuhikuhi komo/tesseract.
  • Ua hoʻolālā hou ʻia ka hoʻokele hoʻomanaʻo, ua hoʻololi ʻia nā malloc āpau a me nā kelepona manuahi me ka code C++. Ua hoʻokō ʻia kahi hana hou o ke code.
  • Hoʻohui ʻia nā optimizations no ARM a me ARM64 architecture; Hoʻohana ʻia nā ʻōlelo aʻoaʻo ARM NEON e wikiwiki i ka helu ʻana. Ua hoʻokō ʻia ka loiloi hana maʻamau i nā hale hana āpau.
  • Ua hoʻokō ʻia nā ʻano hana hou no ka hoʻomaʻamaʻa ʻana i nā kumu hoʻohālike a me ka ʻike kikokikona ma muli o ka hoʻohana ʻana i nā helu lana. Hāʻawi nā ʻano hou i ka hana kiʻekiʻe a me ka hoʻohana haʻahaʻa haʻahaʻa. Ma ka mīkini LSTM, hiki ke hoʻohana ʻia ke ʻano wikiwiki float32 ma ka paʻamau.
  • Ua hana ʻia kahi hoʻololi i ka hoʻohana ʻana i Unicode normalization me ka hoʻohana ʻana i ka palapala NFC (Normalization Form Canonical).
  • Hoʻohui ʻia kahi koho e hoʻonohonoho i ka kikoʻī kikoʻī (--loglevel).
  • Ua hoʻolālā hou ʻia ka ʻōnaehana kūkulu e pili ana i Autotools a hoʻololi ʻia e kūkulu i ke ʻano non-recursive.
  • Ua kapa hou ʻia ka lālā "master" ma Git i "main".
  • Hoʻohui i ke kākoʻo no nā hoʻokuʻu hou o macOS a me nā ʻōnaehana Apple e pili ana i ka chip M1.

    Source: opennet.ru

Pākuʻi i ka manaʻo hoʻopuka