Siideynta nidaamka aqoonsiga qoraalka Tesseract 5.1

Siideynta nidaamka aqoonsiga qoraalka indhaha ee Tesseract 5.1 ayaa la daabacay, isagoo taageeraya aqoonsiga UTF-8 xarfaha iyo qoraallada in ka badan 100 luqadood, oo ay ku jiraan Ruush, Kazakh, Belarusian iyo Yukreeniyaan. Natiijadu waxay ku kaydsan kartaa qoraal cad ama HTML (hOCR), ALTO (XML), PDF iyo qaababka TSV. Nidaamka waxaa markii hore la abuuray 1985-1995 shaybaarka Hewlett Packard; 2005, koodka waxaa lagu furay shatiga Apache waxaana sii kordhay iyada oo ay ka qayb qaadanayaan shaqaalaha Google. Koodhka isha ee mashruuca waxaa lagu qaybiyaa shatiga Apache 2.0.

Tesseract Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² сСбя ΠΊΠΎΠ½ΡΠΎΠ»ΡŒΠ½ΡƒΡŽ ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρƒ ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ libtesseract для встраивания Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ распознавания тСкста Π² Π΄Ρ€ΡƒΠ³ΠΈΠ΅ прилоТСния. Из ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‰ΠΈΡ… Tesseract сторонних GUI-интСрфСйсов ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ gImageReader, VietOCR ΠΈ YAGF. ΠŸΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ΡΡ Π΄Π²Π° Π΄Π²ΠΈΠΆΠΊΠ° распознавания: классичСский, Ρ€Π°ΡΠΏΠΎΠ·Π½Π°ΡŽΡ‰ΠΈΠΉ тСкст Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ шаблонов ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… символов, ΠΈ Π½ΠΎΠ²Ρ‹ΠΉ, Π±Π°Π·ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉΡΡ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ систСмы машинного обучСния Π½Π° Π±Π°Π·Π΅ Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½ΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти LSTM, ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ для распознавания Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ строк ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π΅ΠΉ Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ сущСствСнного увСличСния точности. Π“ΠΎΡ‚ΠΎΠ²Ρ‹Π΅ Π½Π°Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½Ρ‹ для 123 языков. Для ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ΡΡ ΠΌΠΎΠ΄ΡƒΠ»ΠΈ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠ΅ OpenMP ΠΈ SIMD-инструкций AVX2, AVX, NEON ΠΈΠ»ΠΈ SSE4.1.

Horumarka waaweyn ee Tesseract 5.1:

  • Π Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ областСй с изобраТСниями ΠΈ линиями ΠΏΡ€ΠΈ Π²Ρ‹Π²ΠΎΠ΄Π΅ Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°Ρ… ALTO, hOCR ΠΈ text.
  • Π”ΠΎΠ±Π°Π²Π»Π΅Π½ Π½ΠΎΠ²Ρ‹ΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ curl_timeout lkz curl_easy_setop.
  • Nidaam dhis oo la hagaajiyay.
  • ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° ΠΏΠΎ ΡƒΠ΄Π°Π»Π΅Π½ΠΈΡŽ Π½Π΅ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π°
  • УстранСны сбои, Π²Ρ‹Π·Π²Π°Π½Π½Ρ‹Π΅ Π½Π΅ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΎΠΉ Π½ΡƒΠ»Π΅Π²Ρ‹Ρ… ΡƒΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ Π² классС PageIterator::Orientation.

Source: opennet.ru

Add a comment