Випуск системи розпізнавання тексту GNU Ocrad 0.28

Після трьох років з моменту минулого випуску сформовано реліз системи розпізнавання тексту Ocrad 0.28 (Optical Character Recognition), що розвивається під егідою проекту GNU. Ocrad може застосовуватися як у формі бібліотеки для інтеграції функцій OCR до інших додатків, так і у формі відокремленої утиліти, яка на основі переданого на вхід зображення видає текст у UTF-8 або 8-бітових кодуваннях.

Для оптичного розпізнавання Ocrad використовується метод виділення ознак (feature extraction). До складу входить аналізатор макета сторінки, що дозволяє коректно розділяти стовпці та блоки тексту у друкованих документах. Розпізнавання підтримується лише для символів із кодувань «ascii», «iso-8859-9» та «iso-8859-15» (підтримка кирилиці відсутня).

Зазначається, що до нового випуску включена велика порція дрібних виправлень та покращень. Найбільшою зміною стала підтримка формату зображень PNG, реалізованого за допомогою бібліотеки libpng, що значно спростило роботу з програмою, оскільки раніше на вхід могли подаватися лише зображення у форматах PNM.

Джерело: opennet.ru

Додати коментар або відгук