Uitgave van GNU Ocrad 0.28 OCR-systeem

Drie jaar na de laatste release is het tekstherkenningssysteem Ocrad 0.28 (Optical Character Recognition), ontwikkeld onder auspiciën van het GNU-project, uitgebracht. Ocrad kan zowel worden gebruikt in de vorm van een bibliotheek voor het integreren van OCR-functies in andere applicaties, als in de vorm van een afzonderlijk hulpprogramma dat, op basis van de afbeelding die aan de invoer wordt doorgegeven, tekst produceert in UTF-8- of 8-bit-coderingen.

Voor optische herkenning gebruikt Ocrad de feature-extractiemethode. Bevat een pagina-indelingsanalysator waarmee u kolommen en tekstblokken in afgedrukte documenten correct kunt scheiden. Herkenning wordt alleen ondersteund voor tekens uit de coderingen "ascii", "iso-8859-9" en "iso-8859-15" (er is geen ondersteuning voor het Cyrillische alfabet).

Opgemerkt wordt dat de nieuwe release een groot deel van kleine reparaties en verbeteringen bevat. De belangrijkste verandering was de ondersteuning voor het PNG-afbeeldingsformaat, geïmplementeerd met behulp van de libpng-bibliotheek, wat het werken met het programma aanzienlijk vereenvoudigde, aangezien voorheen alleen afbeeldingen in PNM-formaten konden worden ingevoerd.

Bron: opennet.ru

Voeg een reactie