GNU Ocrad 0.28 OCR системасынын чыгарылышы

Акыркы чыгарылыштан үч жыл өткөндөн кийин, GNU долбоорунун колдоосу астында иштелип чыккан Ocrad 0.28 (Оптикалык белгилерди таануу) текстти таануу системасы чыгарылды. Ocrad OCR функцияларын башка тиркемелерге интеграциялоо үчүн китепкана түрүндө да, киргизүүгө берилген сүрөттүн негизинде UTF-8 же 8 биттик текстти чыгарган өз алдынча утилита түрүндө да колдонсо болот. коддоолор.

Оптикалык таануу үчүн Ocrad өзгөчөлүктөрдү алуу ыкмасын колдонот. Басылып чыккан документтердеги тексттин тилкелерин жана блокторун туура бөлүүгө мүмкүндүк берген беттин жайгашуу анализаторун камтыйт. Таануу "ascii", "iso-8859-9" жана "iso-8859-15" коддоолорундагы символдор үчүн гана колдоого алынат (кириллица алфавити колдоого алынбайт).

Жаңы чыгарылыш майда оңдоолордун жана жакшыртуулардын чоң бөлүгүн камтыганы белгиленген. Эң олуттуу өзгөрүү libpng китепканасын колдонуу менен ишке ашырылган PNG сүрөт форматын колдоо болду, бул программа менен иштөөнү бир топ жөнөкөйлөттү, анткени мурда PNM форматындагы сүрөттөр гана киргизилиши мүмкүн болчу.

Source: opennet.ru

Комментарий кошуу