Utgivning av GNU Ocrad 0.28 OCR-system

Efter tre år sedan den senaste utgåvan har Ocrad 0.28 (Optical Character Recognition) textigenkänningssystem, utvecklat under GNU-projektets regi, släppts. Ocrad kan användas både i form av ett bibliotek för att integrera OCR-funktioner i andra applikationer, och i form av ett separat verktyg som baserat på bilden som skickas till ingången producerar text i UTF-8 eller 8-bitars kodningar.

För optisk igenkänning använder Ocrad funktionsextraktionsmetoden. Inkluderar en sidlayoutanalysator som låter dig separera kolumner och textblock korrekt i utskrivna dokument. Igenkänning stöds endast för tecken från kodningarna "ascii", "iso-8859-9" och "iso-8859-15" (det finns inget stöd för det kyrilliska alfabetet).

Det noteras att den nya utgåvan innehåller en stor del av mindre korrigeringar och förbättringar. Den mest betydande förändringen var stödet för PNG-bildformatet, implementerat med libpng-biblioteket, vilket avsevärt förenklade arbetet med programmet, eftersom tidigare endast bilder i PNM-format kunde matas in.

Källa: opennet.ru

Lägg en kommentar