GNU Ocrad 0.28 OCR sisteminin buraxılışı

Son buraxılışdan üç il sonra GNU layihəsinin himayəsi altında hazırlanmış Ocrad 0.28 (Optik xarakter tanınması) mətn tanıma sistemi buraxıldı. Ocrad həm OCR funksiyalarını digər proqramlara inteqrasiya etmək üçün kitabxana şəklində, həm də girişə ötürülən təsvirə əsasən UTF-8 və ya 8 bitlik kodlaşdırmada mətn istehsal edən ayrıca yardım proqramı şəklində istifadə edilə bilər.

Optik tanınma üçün Ocrad xüsusiyyət çıxarma metodundan istifadə edir. Çap edilmiş sənədlərdə mətnin sütunlarını və bloklarını düzgün ayırmağa imkan verən səhifə tərtibatı analizatoru daxildir. Tanınma yalnız "ascii", "iso-8859-9" və "iso-8859-15" kodlaşdırmalarından olan simvollar üçün dəstəklənir (kiril əlifbası üçün dəstək yoxdur).

Qeyd edilir ki, yeni buraxılış kiçik düzəlişlərin və təkmilləşdirmələrin böyük bir hissəsini ehtiva edir. Ən əhəmiyyətli dəyişiklik, libpng kitabxanasından istifadə etməklə həyata keçirilən PNG şəkil formatına dəstək oldu ki, bu da proqramla işi xeyli asanlaşdırdı, çünki əvvəllər yalnız PNM formatlarında olan şəkillər daxil edilə bilərdi.

Mənbə: opennet.ru

Добавить комментарий