Itusilẹ ti eto idanimọ ọrọ Tesseract 5.0

Itusilẹ ti eto idanimọ ọrọ opitika Tesseract 4.1 ti ṣe atẹjade, atilẹyin idanimọ ti awọn ohun kikọ UTF-8 ati awọn ọrọ ni diẹ sii ju awọn ede 100, pẹlu Russian, Kazakh, Belarusian ati Ukrainian. Abajade le wa ni fipamọ ni ọrọ itele tabi ni HTML (hOCR), ALTO (XML), PDF ati awọn ọna kika TSV. Eto naa ni ipilẹṣẹ ni akọkọ ni ọdun 1985-1995 ni yàrá Hewlett Packard; ni ọdun 2005, koodu naa ṣii labẹ iwe-aṣẹ Apache ati pe o ni idagbasoke siwaju pẹlu ikopa ti awọn oṣiṣẹ Google. Awọn koodu orisun ti ise agbese na pin labẹ iwe-aṣẹ Apache 2.0.

Tesseract pẹlu ohun elo console ati ile-ikawe libtesseract fun fifi iṣẹ ṣiṣe OCR sinu awọn ohun elo miiran. Awọn atọkun GUI ẹni-kẹta ti o ṣe atilẹyin Tesseract pẹlu gImageReader, VietOCR ati YAGF. Awọn ẹrọ idanimọ meji ni a funni: Ayebaye kan ti o ṣe idanimọ ọrọ ni ipele ti awọn ilana ihuwasi ẹni kọọkan, ati tuntun kan ti o da lori lilo eto ẹkọ ẹrọ ti o da lori nẹtiwọọki ti nwaye loorekoore LSTM, iṣapeye fun idanimọ gbogbo awọn okun ati gbigba fun significant ilosoke ninu išedede. Awọn awoṣe ikẹkọ ti o ti ṣetan ti ṣe atẹjade fun awọn ede 123. Lati mu iṣẹ ṣiṣe pọ si, awọn modulu lilo OpenMP ati awọn ilana SIMD AVX2, AVX, NEON tabi SSE4.1 ti funni.

Awọn ilọsiwaju pataki ni Tesseract 5.0:

  • Iyipada pataki ni nọmba ẹya jẹ nitori awọn iyipada ti a ṣe si API ti o fọ ibamu. Ni pataki, API libtesseract ti o wa ni gbangba ko ni so mọ GenericVector ati awọn iru data STRING, ni ojurere ti std :: okun ati std :: fekito.
  • Igi ọrọ orisun ti jẹ atunto. Awọn faili akọsori ti gbogbo eniyan ti ti gbe lọ si itọsi pẹlu/tesseract.
  • Iṣakoso iranti ti tun ṣe, gbogbo malloc ati awọn ipe ọfẹ ti rọpo pẹlu koodu C ++. Olaju gbogbogbo ti koodu ti ṣe.
  • Awọn iṣapeye ti a ṣafikun fun ARM ati awọn faaji ARM64; Awọn ilana ARM NEON ni a lo lati yara awọn iṣiro. Imudara iṣẹ ṣiṣe ti o wọpọ si gbogbo awọn ayaworan ile ti ṣe.
  • Awọn ipo tuntun fun awọn awoṣe ikẹkọ ati idanimọ ọrọ ti o da lori lilo awọn iṣiro aaye lilefoofo ti ni imuse. Awọn ipo tuntun nfunni ni iṣẹ ti o ga julọ ati agbara iranti kekere. Ninu ẹrọ LSTM, ipo iyara float32 ti ṣiṣẹ nipasẹ aiyipada.
  • A ti ṣe iyipada si lilo deede Unicode nipa lilo fọọmu NFC (Fọọmu Normalisation Canonical).
  • Ṣafikun aṣayan kan lati tunto alaye akọọlẹ (-loglevel).
  • Eto kikọ ti o da lori Autotools ti tun ṣe ati yipada lati kọ ni ipo ti kii ṣe loorekoore.
  • Ẹka “titunto si” ni Git ti jẹ lorukọmii si “akọkọ”.
  • Atilẹyin ti a ṣafikun fun awọn idasilẹ tuntun ti macOS ati awọn eto Apple ti o da lori chirún M1.

    orisun: opennet.ru

Fi ọrọìwòye kun