Paglabas ng GNU Ocrad 0.28 OCR system

ПослС Ρ‚Ρ€Ρ‘Ρ… Π»Π΅Ρ‚ с ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° ΠΏΡ€ΠΎΡˆΠ»ΠΎΠ³ΠΎ выпуска сформирован Ρ€Π΅Π»ΠΈΠ· систСмы распознавания тСкста Ocrad 0.28 (Optical Character Recognition), Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅ΠΌΠΎΠΉ ΠΏΠΎΠ΄ эгидой ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° GNU. Ocrad ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ ΠΊΠ°ΠΊ Π² Ρ„ΠΎΡ€ΠΌΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ для ΠΈΠ½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ OCR Π² Π΄Ρ€ΡƒΠ³ΠΈΠ΅ прилоТСния, Ρ‚Π°ΠΊ ΠΈ Π² Ρ„ΠΎΡ€ΠΌΠ΅ обособлСнной ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρ‹, которая Π½Π° основС ΠΏΠ΅Ρ€Π΅Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π½Π° Π²Ρ…ΠΎΠ΄ изобраТСния Π²Ρ‹Π΄Π°Ρ‘Ρ‚ тСкст Π² UTF-8 ΠΈΠ»ΠΈ 8-Π±ΠΈΡ‚Π½Ρ‹Ρ… ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²ΠΊΠ°Ρ….

Para sa optical recognition, ginagamit ni Ocrad ang feature extraction method. May kasamang page layout analyzer na nagbibigay-daan sa iyong paghiwalayin nang tama ang mga column at block ng text sa mga naka-print na dokumento. Sinusuportahan lamang ang pagkilala para sa mga character mula sa "ascii", "iso-8859-9" at "iso-8859-15" na mga encoding (walang suporta para sa Cyrillic alphabet).

ΠžΡ‚ΠΌΠ΅Ρ‡Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ Π² Π½ΠΎΠ²Ρ‹ΠΉ выпуск Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Π° большая порция ΠΌΠ΅Π»ΠΊΠΈΡ… исправлСний ΠΈ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠΉ. НаиболСС Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ стала ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ PNG, Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ libpng, Ρ‡Ρ‚ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ упростило Ρ€Π°Π±ΠΎΡ‚Ρƒ с ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΎΠΉ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Ρ€Π°Π½Π΅Π΅ Π½Π° Π²Ρ…ΠΎΠ΄ ΠΌΠΎΠ³Π»ΠΈ ΠΏΠΎΠ΄Π°Π²Π°Ρ‚ΡŒΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ изобраТСния Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°Ρ… PNM.

Pinagmulan: opennet.ru

Magdagdag ng komento